一、jieba库常用函数
二、例
1 import jieba 2 3 txt = open("C:\\中国特色*.txt","r", encoding='utf-8').read() 4 words = jieba.lcut(txt) # 使用精确模式对文本进行分词 5 counts = {} # 通过键值对的形式存储词语及其出现的次数 6 7 for word in words: 8 if len(word) == 1: # 单个词语不计算在内 9 continue 10 else: 11 counts[word] = counts.get(word, 0) + 1 # 遍历所有词语,每出现一次其对应的值加 1 12 13 items = list(counts.items())#将键值对转换成列表 14 items.sort(key=lambda x: x[1], reverse=True) # 根据词语出现的次数进行从大到小排序 15 16 for i in range(10): 17 word, count = items[i] 18 print("{0:<5}{1:>5}".format(word, count))
(词云还没下载好,等下载完再放上来)