当前位置: 首页 > news >正文

改善深层神经网络 第一周:深度学习的实践(四)其他缓解过拟合的方法

后,可以说,在理解上对本周的内容不会存在什么难度。

当然,我也会对一些新出现的概念补充一些基础内容来帮助理解,在有之前基础的情况下,按部就班即可对本周内容有较好的掌握。

本篇继续上篇的内容,在完成正则化部分后,再补充一些课程里提到的其他缓解过拟合的方法。

1.数据增强

之前提到解决过拟合最好的方法就是增加数据量,但受限于各个方面有时获取新数据并不容易。

因此,就出现了数据增强,数据增强并不是引入新数据,而是以一些方式增强现有数据,到达“丰富数据集”的效果。

什么方式?看一眼就明白了:

Pasted image 20251031093931

我们可以对图像进行翻转、裁剪、旋转、模糊、亮度变化等处理。虽然这些样本并没有提供全新的信息,但它们能让模型学习到更广泛的特征变化。

这样的操作看起来有些取巧,但也确实能做到一些查漏补缺,配合正则化有时能实现不错的效果。

简单举个例子:上图里的猫,我们对其处理后并不能提供太多新信息,从高维上讲,模型依旧拟合的是橘猫的模样,但是反转,裁剪后,我们可以改变猫头的位置,在图中的比例。或者在模糊后训练模型的“视力”。模型可以学会识别“同一类目标在不同条件下的表现”,起到丰富低维特征的作用。

要强调一点的是,课程中提到,数据增强也可以被称为一种正则化方法。

2.早停(early stopping)

我们再回顾一下过拟合,在训练神经网络时,我们常常会遇到这样一种现象:

模型在训练集上的损失不断下降,但在验证集上的性能却在某个时刻开始变差——也就是说,模型开始记住训练数据的噪声,出现了过拟合。

“早停”正是针对这一问题的一种简单而有效的策略。

早停的核心思想是:当模型在验证集上的表现不再提升时,就提前停止训练,而不是一味追求训练损失的最小化。

换句话说,我们不让模型在训练集上“学得太好”,而是在它刚开始出现过拟合的拐点提前终止,让模型保持在一个“泛化性能最好”的状态。

通常的做法是:

在每一轮(epoch)训练后,计算模型在验证集上的损失;

如果验证集损失在连续若干轮(称为耐心值 patience)中没有显著改善,就停止训练;

最后保留验证集效果最好的那一轮的模型参数。

如图所示:

Pasted image 20251031101136

总的来说,早停的优点在于它能在验证集性能开始下降前及时停止训练,从而有效防止过拟合,并节省训练时间;实现起来也十分简单。

但它也有不足——如果停止得太早或验证集波动较大,模型可能还没学到足够的特征就被迫中断,导致欠拟合;同时,早停依赖验证集的表现,可能带来一定的不稳定性。

本篇内容不多,加上前两篇,这部分内容总结了一些帮助缓解过拟合的方法,涉及到一些新的概念,因此花费了一些篇幅来帮助理解,之后的内容在理解上的难度就没有这部分高了,进度也会快一些。

http://www.cnnetsun.cn/news/40779.html

相关文章:

  • 品牌营销 深度心智方法论
  • STM32之使用DWT外设编写延时函数
  • 选择中国优化路线的美国独立服务器的8大好处
  • Abaqus三维纤维复合材料Vumat子程序:弹性层压板+Hashin损伤(纤维)+Puck损...
  • 移动应用无障碍测试完全指南:如何用Maestro实现WCAG标准自动化验证
  • Effective C++ 中文版第3版:C++进阶编程的终极指南
  • Slang光线追踪加速结构深度解析:从理论到性能优化实践
  • DeepSeek-R1-Distill-Qwen-7B集群部署终极指南:轻松搞定AI推理服务
  • 风储调频在Matlab/Simulink中的探索:基于四机两区系统的实践
  • 基于Java Swing的猜数字小游戏(2)
  • 提升 Web 端 JavaScript 的可信度:WAICT 体系详解
  • Solon (可替换 SpringBoot)集成 Docker 实战:30分钟搞定轻量级应用容器化部署
  • 一次 React 项目 lock 文件冲突修复:从 Hook 报错到 Vite 配置优化
  • 记录一次USB虚拟网络问题排查
  • 学Simulink——基于高比例可再生能源渗透的复杂电网建模场景实例:大规模光伏并网对区域电网频率稳定影响研究
  • CANN Samples(十九):特色场景:机器人 AI 绘画 手写识别等
  • 毕设开源 深度学习YOLO交通路面缺陷检测系统(源码+论文)
  • 【URP】Unity[后处理]色彩调整ColorAdjustments
  • Flutter混合开发与WebView集成实战
  • 压缩空气储能和释能阶段模型,附相关文档文献。 建立了压缩空气储能系统中的压缩机、换热器、储气罐...
  • Profinet转Modbus TCP工业数据采集网关:实现1200PLC 与打标卡数据实时传输
  • Flutter 2025 国际化与本地化实战:从多语言支持到文化适配,打造真正全球化的用户体验
  • P1178 到天宫做客 题解
  • 2025年GEO优化机会与争议以及规范发展的必要性
  • 2026老年春晚怀化区域节目征集启动仪式在怀化学院举行
  • 【笔记篇】【硬件基础篇】电力电子元器件应用手册 阅读笔记(1)电阻器及其应用
  • 柠檬 软件测试之python全栈自动化测试工程师第25期
  • 为什么你的视觉AI项目总是耗时又低效?Florence-2-large-ft一站式解决方案
  • 基于php的微信小程序的学习交流平台系统(源码+lw+部署文档+讲解等)
  • springboot高校读书分享系统的设计与实现_34ur7fyk-