正则化的定义:其用于解决模型因强大的表征力而产生测试数据过拟合等现象,通过避免训练完美拟合数据来加强算法的泛化能力。因此,算法正则化的研究成为机器学习中重要的研究主题之一。
- 表征力:表达信息量。
1.数据增强
数据增强为的是提升算法性能、满足深度学习模型对大量数据需求的重要工具。
一般方法有:水平或垂直翻转图像、裁剪、色彩变换、缩放和旋转等。
2.权重衰减
加入正则化参数λ,更新权重w。λ越小正则化作用越弱,主要用来优化原本的损失函数。λ越大正则化作用越明显,权重w越趋近于0(原因是正则化作为系数λ/2n存在于损失函数中)。
3.Dropout
Dropout通过暂时丢弃一部分神经元及其连接。在每一轮的训练过程中以一定的概率丢弃神经元,被丢弃的参数不更新,减少了神经元之间的共适应。其不仅降低了过拟合,同时做到了减少训练节点提高算法学习速度。
-
权重衰减方法是通过修改损失函数的方法,而Dropout通过修改网络结构实现。
-
共适应:神经元之间的特征相互依赖,防止过拟合。
4.提前停止(早停法)
提前停止可以限制模型最小化代价函数所需的训练迭代次数。即可以提前停止训练,是机器学习最简单的正则化方法。