说明:基于DataFrame结构的词频表生成词云图
代码
from wordcloud import WordCloud
import matplotlib.pyplot as plt
frequencies = {}
count = 0
for line in open(".\ham.txt"):
count += 1
if count > 1:
arr = line.split(" ")
frequencies[arr[0].strip()] = int(arr[1].strip())
wc = WordCloud(
max_words=100,
width=400,
height=400,
)
word_cloud = wc.generate_from_frequencies(frequencies)
# 写词云图片
word_cloud.to_file("wordcloud_ham.jpg")
# 显示词云文件
plt.imshow(word_cloud)
plt.axis("off")
plt.show()
ham.txt文件已上传:ham.txt
生成图片

本文介绍了如何使用Python中的WordCloud库,从名为ham.txt的文本文件中提取词频,生成并展示词云图,展示了数据预处理和可视化过程。
320

被折叠的 条评论
为什么被折叠?



