Python 词云

Python 词云

穿过长长的县道,便是雪国。
在看黄杏元的GIS书籍,按照图论中用相邻矩阵来表示图是应该和书上一样全写出来的。但在寻找最短路径时候只用到了第一行向量,所以分析过程就简化了。
之后考虑会使用Python或者C++来实现一个简单图的Dijkstra算法,目前只是计划,具体什么时候写看时间吧。

import wordcloud
import jieba
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt


txt =open('line.txt','r',encoding='utf-8') #打开文件
text=txt.read()# 读整个文件
txt.close()# 关闭文件
#print(jb)

#jieba中文分词
text=' '.join(jieba.lcut(text))

## 获取图形的颜色和图片 numpy
maskcover= np.array(Image.open('love.jpeg') )

w = wordcloud.WordCloud(font_path="simsun.ttc",mask=maskcover)
w.generate(text)
w.to_file("wc.png")

# 展示词云
plt.imshow(w)
plt.axis('off')
plt.show()

待改进之处

  1. 对词云的字数做出限制
  2. 背景蒙版的修改
  3. 代码优化
  4. 字体大小的赋权显示
  5. jieba库的熟悉

Reference

1.Python wordcloud库学习小结
2.Linux下安装中文字体库

上一篇:python入门之jieba库的使用


下一篇:在Python中利用wordcloud生成词云