案例代码注意点|学习笔记

开发者学堂课程【深度学习框架 TensorFlow 入门案例代码注意点学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/773/detail/13547


案例代码注意点


内容介绍:  

一、学习率的设置、步数的设置与梯度爆炸

二、变量的trainable设置观察


一、学习率的设置、步数的设置与梯度爆炸

学习率越大,训练到较好结果的步数越小;学习率越小,训练到较好结果的步数越大。

但是学习过大会出现梯度爆炸现象。关于梯度爆炸/梯度消失?

在极端情况下。权重的值变得非常大,以至于溢出,导致 NaN 值

如何解决梯度爆炸问题(深度神经网络当中更容易出现)

1、重新设计网络

2、调整学习率

3、使用梯度戳断(在训练过程中检查和限制梯度的大小

4、使用激活函数


二、变量的 trainable 设置观察

trainable 的参数作用,指定是否训练

weights=tf.Variable(initial_value=tf.random_normal( shape=[1, 1]),trainable=False)

上一篇:[转]区块链代码快速学习实践


下一篇:LeetCode-1.两数之和 C++用暴力法与哈希表法分别实现