开发者学堂课程【深度学习框架 TensorFlow 入门:案例代码注意点】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/773/detail/13547
案例代码注意点
内容介绍:
一、学习率的设置、步数的设置与梯度爆炸
二、变量的trainable设置观察
一、学习率的设置、步数的设置与梯度爆炸
学习率越大,训练到较好结果的步数越小;学习率越小,训练到较好结果的步数越大。
但是学习过大会出现梯度爆炸现象。关于梯度爆炸/梯度消失?
在极端情况下。权重的值变得非常大,以至于溢出,导致 NaN 值
如何解决梯度爆炸问题(深度神经网络当中更容易出现)
1、重新设计网络
2、调整学习率
3、使用梯度戳断(在训练过程中检查和限制梯度的大小
4、使用激活函数
二、变量的 trainable 设置观察
trainable 的参数作用,指定是否训练
weights=tf.Variable(initial_value=tf.random_normal( shape=[1, 1]),trainable=False)