LSTM核心
1.单元状态(LSTM独有)
联系三个门的结构,为数据做更新。
1.与遗忘门结构相乘
2.与输入门结果相加
3.经过sigmoid函数计算
4.与输出门结果相乘
2.遗忘门:决定信息是否保存
方法: 通过sigmoid函数(上一个隐状态信息,当前输入信息)计算并压缩为[0,1]的值,决定是否保留。近0丢弃,近1保留
3.输入门:更新单元状态
- 1.通过sigmoid函数(上一个隐状态信息,当前输入信息)计算为[0,1]的值决定更新那些值,近0不主要,近1重要
- 2.通过tanh函数(上一个隐状态信息,当前输入信息),计算出[-1,1]的值辅助调节
- 3.将sigmoid函数和tanh相乘,sigmoid输出将决定保留tanh输出的重要信息
4.输出门:决定下一个隐状态
- 1.通过sigmoid函数(上一个隐状态信息,当前输入信息)产生[0,1]结果
- 2.经过tanh(单元状态)的结果和1的结果相乘