当前位置: 首页 > news >正文

深度学习基础—其他正则化技巧

(1)数据扩增

        如果一个样本集的数据不容易扩增,那么可以通过一些改变样本的手段伪造数据。比如在图片识别中,图片的数据集不容易获取,那么我们可以将图片进行放大、缩小、水平反转等方式,从而构造出新的数据集,这种方式虽然没有获取新的训练集数据效果好,但是成本低代价小,起到的效果也类似正则化,可以缓解过拟合问题,因此可以作为一种正则化手段。

(2)提前结束训练

        过拟合实际上是模型参数越来越多、越来越大的现象,如下图所示,验证集的损失随着迭代次数先降后升,训练集的损失随着迭代次数逐渐下降:

        为了缓解过拟合现象(验证集和训练集之间的方差大),可以在虚线所在位置提前结束训练,这样训练集和验证集之间的差距较小,从而缓解了过拟合。

        但是这样做有缺点:我们训练一个性能优良的模型,往往需要考虑两个问题,一个是优化算法的选择,另一个是选择了优化算法之后,我们不希望模型过拟合。提前结束训练将这两个问题的解决统一起来了,而这两个问题应该独立讨论。即我们虽然缓解了过拟合问题,也选择的优化算法,但是优化算法的效果最终是好是坏,我们并不清楚(因为如上图,优化算法的损失还可以继续下降)。因此训练出来的模型表现并不一定是最好的。


http://www.mrgr.cn/news/4806.html

相关文章:

  • 网络性能优化:从问题诊断到解决方案
  • 10秒记住C语言运算优先级
  • 软考:软件设计师 — 15.数据结构及算法应用
  • 29 python脚本使数据库读写分离,mysql主从开机自动同步,python操作数据库,MyCat插件的学习
  • 2024河南省萌新联赛第(六)场 郑州大学
  • 【安全】XSS
  • 鸿蒙内核源码分析(物理内存篇) | 怎么管理物理内存
  • 【Vue】模板语法
  • PHP 常用函数
  • FDD与TDD——两种双工模式
  • 深入认识微信小程序openid
  • css之grid布局(网格布局)
  • ES的介绍和使用
  • 【链表在Java中DeBug】
  • 机器学习-KNN 算法
  • Linux 安装TELEPORT堡垒机
  • PDF 转Word 开源库
  • 每日一题-贪心算法
  • 【业余玩儿AI】【文档问答】实操记录0822
  • Redis7基础篇(一)