当前位置: 首页 > news >正文

7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析

7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析

机器学习模型在未知数据上的泛化误差是其核心性能的最终度量。理解这一误差的来源,并系统性地对其进行控制,是模型设计与优化的关键。偏差-方差分解为此提供了一个强大的理论框架,它将期望泛化误差清晰地分解为可解释的组成部分,从而将实践中观察到的欠拟合过拟合现象置于严格的理论分析之下。本节将详细阐述这一分解的推导过程、各项成分的统计含义,并基于此框架讨论模型选择与正则化策略的本质。

7.5.1 问题定义:期望预测误差的分解

考虑一个回归问题。设数据由真实函数f ( x ) f(\mathbf{x})f(x)和加性随机噪声ϵ \epsilonϵ生成,其中ϵ \epsilonϵ服从零均值、方差为σ 2 \sigma^2σ2的分布,即y = f ( x ) + ϵ y = f(\mathbf{x}) + \epsilony=f(x)+ϵ,且E [ ϵ ] = 0 \mathbb{E}[\epsilon] = 0E[ϵ]=0Var ( ϵ ) = σ 2 \text{Var}(\epsilon) = \sigma^2Var(ϵ)=σ2

给定一个从数据D DD中学习得到的模型f ^ D ( x ) \hat{f}_D(\mathbf{x})f^D(x),其在某一固定输入点x \mathbf{x}x处的期望预测误差(或称期望测试误差)可以分解为偏差、方差和不可约噪声三部分。这里期望是对所有可能的数据集D DD(来自同一数据生成分布)以及噪声ϵ \epsilonϵ取的。

以平方损失为例,在x \mathbf{x}x点的期望预测误差为:
Err ( x ) = E D , ϵ [ ( y − f ^ D ( x ) ) 2 ] = E D , ϵ [ ( f ( x ) + ϵ − f ^ D ( x ) ) 2 ] \begin{aligned} \text{Err}(\mathbf{x}) &= \mathbb{E}_{D, \epsilon} \left[ (y - \hat{f}_D(\mathbf{x}))^2 \right] \\ &= \mathbb{E}_{D, \epsilon} \left[ (f(\mathbf{x}) + \epsilon - \hat{f}_D(\mathbf{x}))^2 \right] \end{aligned}Err(x)=ED,ϵ

http://www.cnnetsun.cn/news/142572.html

相关文章:

  • 【2025最新】基于SpringBoot+Vue的企业项目管理系统管理系统源码+MyBatis+MySQL
  • 企业级大学生考勤系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 【2025最新】基于SpringBoot+Vue的物资综合管理系统管理系统源码+MyBatis+MySQL
  • 数学梗图数据集分析报告:999张高质量数学主题幽默图片资源
  • 【毕业设计】SpringBoot+Vue+MySQL 美食信息推荐系统平台源码+数据库+论文+部署文档
  • AI核心知识59——大语言模型之Mamba(简洁且通俗易懂版)
  • SpringBoot+Vue 流浪动物救助平台平台完整项目源码+SQL脚本+接口文档【Java Web毕设】
  • SpringBoot+Vue 手机销售网站管理平台源码【适合毕设/课设/学习】Java+MySQL
  • DPJ-138 基于单片机的指纹密码锁系统设计(源代码+proteus仿真)
  • SpringBoot+Vue 流浪动物救助平台管理平台源码【适合毕设/课设/学习】Java+MySQL
  • 【2025最新】基于SpringBoot+Vue的考试系统管理系统源码+MyBatis+MySQL
  • 企业级流浪动物救助平台管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 物资综合管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • MLX 有多快?在 8 个苹果硅芯片和 4 个 CUDA GPU 上的全面基准测试
  • 生产就绪特性-从开发到部署的完整解决方案
  • 【前端知识点总结】Promise的介绍
  • 2026年河北省职业院校技能大赛“网络系统管理”(高职组)系统服务-Linux部署样题
  • 当 AI 写论文遭遇 “答辩级拷问”:9 款主流工具的生死考验
  • 科研人的 “数据魔咒”:明明数据在手,却挖不出核心结论
  • [特殊字符] 写论文软件哪个好?先看毕业党最在意的 4 大核心标准
  • 历年贵州大学计算机保研复试机试真题
  • AI产业融合纵深发展,治理创新护航智能未来
  • 生成式AI重构内容生态,人机协同定义创作新范式
  • 软件世界的契约:理解开源协议的逻辑与边界
  • vue和springboot框架开发的小程序 智能包裹配送服务管理系统_q3k407ra
  • C 语言输入与输出(I/O)详解
  • 软件测试成本的多维解析与优化路径
  • 5-脱氧-L-阿拉伯糖—结构独特的稀有单糖,药物设计与合成化学的宝贵砌块 CAS:13039-56-0
  • 2-乙酰胺基-1,3,4,6-四-O-乙酰基-2-脱氧-5-硫代-α-D-吡喃葡萄糖 —— 糖化学与药物研发的关键砌块 CAS:67561-97-1
  • 群体分析如何改变你的客户洞察