WordCloud的使用方法

最新推荐文章于 2025-10-23 01:24:16 发布

原创最新推荐文章于 2025-10-23 01:24:16 发布 · 589 阅读

0 ·

CC 4.0 BY-SA版权

这段代码展示了如何利用jieba分词和WordCloud库对文本进行处理和可视化。首先，通过pickle加载章节内容，然后读取停用词列表，使用jieba进行文本分词并过滤掉停用词。接着，将处理后的字符串传递给WordCloud生成词云，并指定背景图片。最终，展示词云图，其中的词频反映了文本中各词汇的重要性。

1.安装WordCloud

pip install wordcloud

2.导入

import pickle
import jieba
import pandas as pd
import wordcloud
import matplotlib.pyplot as plt
from imageio import imread
#%%
#读取chapter


pickle_file = open(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\SDTest\chapter.pkl','rb')
chapter = pickle.load(pickle_file)
pickle_file.close()

#%%
#读取停用词
stoplist = list(pd.read_csv(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\停用词.txt',
                            names=['w'],sep='aaa',encoding='UTF-8',engine='python').w)

def m_cut(intxt):
    return [w for w in jieba.cut(intxt) if w not in stoplist and len(w) > 1]

ls = " ".join(m_cut(chapter.txt[1]))
#%%
cloudobj = wordcloud.WordCloud(mask=imread(r'C:\Users\yandi\PycharmProjects\MachineLearing\LearningTest01\射雕背景0.jpg'),
                               mode='RGBA',background_color=None
                               ).generate(ls)
#%%
plt.imshow(cloudobj)
plt.axis('off')
plt.show()