我在用wordcloud库统计中文文档时,出现了如下的图片:

后来查阅资料,发现原来是wordcloud库默认matplotlib库下自带的字体DejaVuSans.TTF,这一字体对中文支持不好导致了乱码的出现。
我们只需要在引入词云时加入相应的参数,将字体改为匹配中文的文字库即可,如下(改为微软雅黑):
w=wordcloud.WorldCloud( font_path = "myth.ttc")
这样上述问题就顺利解决了,而且字体文件好像不需要指定保存的目录,可能已经存在于系统环境变量中了吧。
本文介绍了使用WordCloud库处理中文文档时遇到的乱码问题,原因是默认字体不支持中文。通过更换字体为微软雅黑,成功解决了乱码问题。
3202

被折叠的 条评论
为什么被折叠?



