李宏毅《机器学习》飞桨特训营(十)
一. 循环神经网络
视频(上) | 视频(下) | PPT |
---|
内容总结1 | 内容总结2 |
---|
二. 词向量(Word Embedding)
在自然语言处理任务中,词向量(Word Embedding)是表示自然语言里单词的一种方法,即把每个词都表示为一个N维空间内的点,即一个高维空间内的向量。通过这种方法,实现把自然语言计算转换为向量计算。
如图所示的词向量计算任务中,先把每个词(如queen,king等)转换成一个高维空间的向量,这些向量在一定意义上可以代表这个词的语义信息。再通过计算这些向量之间的距离,就可以计算出词语之间的关联关系,从而达到让计算机像计算数值一样去计算自然语言的目的。
关于构建词向量的方法及基于飞桨的实现,请参考:
https://www.paddlepaddle.org.cn/tutorials/projectdetail/2201246#anchor-1
简而言之,构建词向量就是为了让每个词语对应一个唯一的id,每个id对应一个唯一的向量。然后用向量去做训练、预测等。
三. 作业:语句分类
⭐方案一 | 方案二 |
---|
(RNN这部分的内容理解起来比较费力/(ㄒoㄒ)/~~,还需要多花时间钻研)