import jieba
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import matplotlib.pyplot as plt
import pandas as pd
def get_word():
df = pd.read_csv('weixiaobao_data/wen.txt', sep='\t')
word_list = df['MsgTitle'].tolist()
return word_list
def get_word_list(mylist):
word_list = [' '.join(jieba.cut(sen)) for sen in mylist]
new_text = ' '.join(word_list)
pic_path = 'buity.jpg'
im_mask = imread(pic_path)
wordcloud = WordCloud(background_color='white',
font_path=r'C:\Windows\Fonts\simfang.ttf',
mask=im_mask,
stopwords=STOPWORDS).generate(new_text)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
wordcloud.to_file('ciyun.jpg')
word_list = get_word()
get_word_list(word_list)

过程中常会出现的一个错
jieba分词与词云图制作常见问题及解决方案

博客介绍了使用jieba进行中文分词时遇到的字体错误问题,详细解析了错误原因——系统缺少特定字体。解决方法是找到字体的英文名称,并将其作为参数设置在词云图的font_path中。
最低0.47元/天 解锁文章
619

被折叠的 条评论
为什么被折叠?



