from gensim.models import Word2Vec
from gensim.models.word2vec import LineSentence # 原始的训练语料转化成一个sentence的迭代器,每一次迭代返回的sentence是一个word(utf8格式)的列表
def vctor_word():
# wiki_news = open('wiki.zh.jian.seg.txt', 'r',encoding='utf-8')
wiki_news = open('weibo_content.txt', 'r', encoding='utf-8')
sentences=LineSentence(wiki_news)
model=Word2Vec(sentences,sg=0,size=100,window=5,min_count=5,workers=9)
model.save('zhiwiki_news.word2vec')
vctor_word()
相关文章
- 03-08#轮廓线dp,模型转换#洛谷 3226 [HNOI2012]集合选数
- 03-08中文刊上用中介效应模型的实证文章? 这位学者使用频率很高!
- 03-08如何选择正确的因变量(控制变量),让你的计量模型不再肮脏
- 03-08什么时候需要标准化回归模型中的变量?
- 03-08ROS机器人 (三) : xacro模型搭建小车
- 03-08微软开源工具包NNI:自动特征工程、NAS、超参调优、模型压缩
- 03-08Uber的合成训练数据将深度学习的速度提升了9倍
- 03-08goroutine基于线程池的P:M:G协程模型
- 03-08go语言-面向并发的内存模型
- 03-08Goroutine 并发调度模型深度解析之手撸一个高性能 goroutine 池