1.词云介绍
“词云”拼音是cí yún,由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。
词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
2.实例代码
import jieba as j
import wordcloud as wc
import imageio
mask = imageio.imread("cloud.png")
with open("关于实施乡村振兴战略的意见.txt","r",encoding="utf-8") as f:
txt = f.read()
str = " ".join(j.lcut(txt))
w = wc.WordCloud( font_path= "msyh.ttc",width=1000,height=700,\
mask= mask, background_color="white")
w.generate(str)
w.to_file("XiangCunZhanLueV2.png")
生成图片: