统计西游记词频

利用jieba库统计西游记重出现最多次的20个词

import jieba


f = open('4447.txt', mode='r',encoding='GB18030')
txt = f.read()
txt = jieba.lcut(txt)


buyao = ['。',',',':','“','”','?','、','《','》','!','!','\n']

count = {}
for ch in txt:
    if ch not in buyao:
        count[ch] = count.get(ch, 0) + 1
items = list(count.items())
items.sort(key=lambda x: x[1], reverse=True)

for i in range(20):
    rw, gs=items[i]
    print("{0:5} {1:5}".format(rw, gs))

统计西游记词频

 

 通过运行结果我们可以看出,西游记的描述多是采用第一人称的方式

上一篇:vue中复制剪贴板的图片或者复制图片网址上传图片


下一篇:java设计模式之迭代器