Python 词云
#matplotlib #wordcloud #NLP
在进行词云展示之前需要对文本数据进行分词处理,处理为一定格式的词的汇总的形式,常用到的工具有jieba,nltk等。
from wordcloud import WordCloud
from wordcloud import *
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
color_mask = mpimg.imread("./th.jpg") # 读取背景图片
image_colors = ImageColorGenerator(color_mask)
cloud = WordCloud(
#设置字体,不指定就会出现乱码
font_path="simkai.ttf",
#font_path=path.join(d,'simsun.ttc'),
#设置背景色
background_color='white',
#词云形状
mask=color_mask,
#允许最大词汇
max_words=200,
#最大号字体
max_font_size=2000
)
word_cloud = cloud.generate(str(wds)) # 产生词云
# 显示词云图片
plt.imshow(word_cloud)
word_cloud.to_file("pjl_cloud4.jpg") #保存图片
#Matplotlib
plt.title('name') #为图像添加标题
plt.xlabel(‘name’) #添加x轴标签
plt.ylabel(‘name’) #添加y轴标签
plt.plot(x,y,‘ob’) #画出有关xy的图像,并设置点的形状和颜色
plt.subplot(2, 1, 1) &

本文介绍了如何使用Python进行词云展示,首先需要对文本数据进行分词处理,如利用jieba或nltk工具。接着,通过Matplotlib库设置图像标题、坐标轴标签,并绘制相关图像。然后,使用wordcloud库创建词云对象并生成词云,最后将其保存为图片文件。解决imread导入失败问题的链接也一并提供。
最低0.47元/天 解锁文章
15万+





