有txt文本和图片，就能用python生成词云图

2023-07-23 22:47:04

使用现有的txt文本和图片，就可以用wordcloud包生成词云图。大致步骤是：

1、读取txt文本并简单处理；

2、读取图片，以用作背景；

3、生成词云对象，保存为文件。

需要用到3个库：jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心，用于生成词云)。

我用简历和我的照片，生成了一个词云图，如下：

代码如下：

import jieba
import imageio
import wordcloud


# 读取txt文本
with open('resume.txt','r',encoding='utf-8') as f:
    text = f.read()

# 简单处理文本，删除空格等多余字符
text = text.replace(' ','').replace('\t','').replace('\n','')
# 使用jieba分隔词语
wordlist = jieba.lcut(text)   # ['aa','bb','cc'...]
# print(wordlist)
# 用空格连接各个词语，又形成一个大字符串
string = ' '.join(wordlist)   # 'aa bb cc'

# 读取图片
image = imageio.imread('ding.jpg')


# 生成词云图片
# 先实例化一个词云对象
wc = wordcloud.WordCloud(width=image.shape[0],  # 词云图宽度同原图片宽度
                        height=image.shape[1],
                        background_color='white',  # 背景颜色白色
                        font_path='msyh.ttc',  # 指定字体路径，微软雅黑，可从win自带的字体库中找
                        mask=image,   # mask 指定词云形状图片，默认为矩形
                        scale=3)   # 默认为1，越大越清晰
# 再给词云输入文字
wc.generate(text)
# 保存成文件
wc.to_file('wordcloud21.png')

码农公寓

相关文章