词云算是社交数据分析必不可少的一项技能了吧。下面就从安装到生成词云整个过程详细做个介绍。
安装wordcloud
pip install wordcloud
如果安装出错,细心的人会发现,cmd上面已经给出了解决方案。
其一,从http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud下载whl文件
再 pip install filename.whl
备注:不要图方便把原先的whl文件名改了,否则要重新下载。
其二,在pip install 失败时,cmd明确指出了error:Microsoft Visual C++ 14.0 is required. 而且在error后面还提供了该文件的下载地址,进入下载地址页面下载后安装再重新pip install wordcloud 即可成功。
相比一的方法,个人觉得这个才是治本的方案,尽管在安装Microsoft Visual C++ 14.0时有些慢。
安装成功啦,接下来开始放代码。。。
import 库
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS
import wordcloud
import jieba
from scipy.misc import imread
因为这篇介绍的是中文词云,所以word cloud的STOPWORDS库不是必须的。
读取text
text =