哈喽大家好呀,这里是滑稽研究所。本期我们利用jieba库和wordcloud库结合制作词云。我们首先需要解决字体问题。之前每次用到中文分词(字体选择微软雅黑)产生词云图时,都提醒我目录下找不到相应的字体,本来有点懵,后来想明白了,系统提示相关目录没有,咱就给它整一个呗。
记得以前计算机老师讲课告诉我们系统里是自带字体库的,于是问了一下度娘字体库在系统哪个路径里,度娘告诉我。(C:\Windows\Fonts)打开之后就是这样。嗯,度娘真好用~
接下来就简单了,选择微软雅黑,复制,粘贴到脚本运行的目录下,运行,没有报错,一切都是那么完美。下面是源代码。
jieba库的功能简单好用,就是分词,最常用的有两个模式,精确模式也就是第一种,全模式,也就是第二种,这里把两个放在一起对比一下可以发现,第一种分词返回的类型更常见,而第二种全模式,则把所有可能的分词都列了出来。当然最常用的还是第一种。
wordcloud: