循环神经网络(RNN)入门帖：向量到序列，序列到序列，双向RNN，马尔科夫化

2024-03-25 17:00:22

rnn似乎更擅长信息的保存和更新，而cnn似乎更擅长精确的特征提取；rnn输入输出尺寸灵活，而cnn尺寸相对刻板。

1发问

聊到循环神经网络RNN，我们第一反应可能是：时间序列（time sequence）。

确实，RNN擅长时间相关的应用（自然语言，视频识别，音频分析）。但为什么CNN不容易处理时间序列而RNN可以？为什么我们之前说过RNN有一定的记忆能力？

2普通预测

数学上，如果我们想要预测一个单词x 的后一个单词y，我们需要3个主要元素（输入单词x；x的上下文状态h1；通过x和h1输出下一个单词的函数比如softmax）：

来自：http://suriyadeepan.github.io/2017-01-07-unfolding-rnn/
数学计算如下：

上面是一个很简单的有向无环图（DAG），但是，这只是一个时刻t 的单词预测，这种简单的预测甚至可以用cnn或者其他简单预测模型替代。

3RNN的引入

然而，cnn对于更新状态或者保存状态却并不擅长，我们知道，下一个时间点t+1，单词x的上下文（状态）就改变了：

因此，RNN的门限结构和CNN卷积结构的不同（信息保存方式的不同）也一定程度导致RNN擅长处理时间序列的问题。即使我们不用门限网络而用其他模型，我们也需要类似上图的循环结构，把上下文状态在每一个时间点进行更新，并保存下来。

所以，在时间序列的应用中，更新每个时间点的状态是如此重要，我们需要rnn这样的网络：

在每个时间点，都使用同样的更新函数f 更新上下文状态，每个时间点t的状态都是基于上一个时间点t-1的状态和本次信号xt的输入：

另外，RNN的门限网络有天然的马尔科夫化的性质，当前的状态S3经过多次循环已经包含了几个时间点以前的状态信息（其中分号代表用参数θ编码前面状态）：

当前的预测只需要根据当前的状态进行预测。这种巨大的保存状态信息的能力似乎正是RNN门限单元擅长的。（cnn似乎更擅长精确的特征提取）