开源共享一个训练好的中文词向量(语料是*的内容,大概1G多一点)

使用gensim的word2vec训练了一个词向量。

语料是1G多的*,感觉词向量的质量还不错,共享出来,希望对大家有用。

下载地址是: http://pan.baidu.com/s/1boPm2x5

包含训练代码、使用词向量代码、词向量文件(3个文件)

开源共享一个训练好的中文词向量(语料是*的内容,大概1G多一点)

开源共享一个训练好的中文词向量(语料是*的内容,大概1G多一点)

因为机器内存足够,也没有分批训练。所以代码非常简单。也在共享文件里面,就不贴在这里了。

上一篇:好好的研究员,怎么去了一趟CVPR都变成了“老铁”


下一篇:word2vec训练&IC分词(待)