wordcloud 默认会以 空 格 \textcolor{red}{空格} 空格或 标 点 \textcolor{red}{标点} 标点为分隔符对目标文本进行分词处理。
中文词云
#对于中文文本,分词处理需要由用户来完成。
#一般步骤是先将文本分词处理,然后以空格拼接,再调用 wordcloud 库函数。
import jieba # 调用 jieba 库——分词
from wordcloud import WordCloud # 调用 wordcloud 库的核心 WordCloud 类——词云
txt = '全国计算机等级考试 Python 科目' # 文本
words = jieba.lcut(txt) # 精确分词
newtxt = ' '.join(words) # 空格拼接
wordcloud = WordCloud(font_path="msyh.ttc").