word2vec及其优化

1.word2vec

算法原理:

分类:crow和skip-gram

参数设置:

embedding_dimensions = number_of_categories**0.25,the embedding vector dimension should be the 4th root of the number of categories



作者:单向街
链接:https://www.zhihu.com/question/60648826/answer/284809398
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

核心代码:

优点:

缺点:

优化方法:hierarchical softmax和随机负采样

2.item2vec

3.topic2vec

airbnb embedding

4.wav2vec

参考:

【1】https://zhuanlan.zhihu.com/p/86680049

上一篇:大数据相关资料汇总


下一篇:程序员才能看得懂的段子