随机梯度下降法实例

学习率 learning_rate:表示了每次参数更新的幅度大小。学习率过大,会导致待优化的参数在最 小值附近波动,不收敛;学习率过小,会导致待优化的参数收敛缓慢。
在训练过程中,参数的更新向着损失函数梯度下降的方向。
参数的更新公式为:

上一篇:学习率的选取-滑动平均


下一篇:Tensorflow框架(人工智能实践笔记)