李宏毅《机器学习》飞桨特训营(十)——循环神经网络(含作业:语句分类)

李宏毅《机器学习》飞桨特训营(十)

一. 循环神经网络

视频(上) 视频(下) PPT
内容总结1 内容总结2

二. 词向量(Word Embedding)

在自然语言处理任务中,词向量(Word Embedding)是表示自然语言里单词的一种方法,即把每个词都表示为一个N维空间内的点,即一个高维空间内的向量。通过这种方法,实现把自然语言计算转换为向量计算。

如图所示的词向量计算任务中,先把每个词(如queen,king等)转换成一个高维空间的向量,这些向量在一定意义上可以代表这个词的语义信息。再通过计算这些向量之间的距离,就可以计算出词语之间的关联关系,从而达到让计算机像计算数值一样去计算自然语言的目的。

李宏毅《机器学习》飞桨特训营(十)——循环神经网络(含作业:语句分类)
关于构建词向量的方法及基于飞桨的实现,请参考:
https://www.paddlepaddle.org.cn/tutorials/projectdetail/2201246#anchor-1

简而言之,构建词向量就是为了让每个词语对应一个唯一的id,每个id对应一个唯一的向量。然后用向量去做训练、预测等。

三. 作业:语句分类

⭐方案一 方案二

(RNN这部分的内容理解起来比较费力/(ㄒoㄒ)/~~,还需要多花时间钻研)

上一篇:使用Eclipse把java文件打包成jar


下一篇:【转载】 使用t-SNE可视化图像embedding