python词云 wordcloud+jieba生成中文词云图

简介

Python+jieba+wordcloud+txt+gif生成动态中文词云

本文基于爬虫爬取某微信号三个月的文章为例,展示了生成中文词云的完整过程。本文需要的两个核心Python类库:

  • jieba:中文分词工具
  • wordcloud:Python下的词云生成工具 

准备 

  • anaconda:一个开源的Python发行版本,用于管理Python版本,可以实现管理不同的Python版本(Python2和Python3)
  • Pycharm:Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具。安装第三方库很方便。

     

jieba介绍

import jieba
str = "明明知识点都熟记于心,可是在考试的时候脑子一片空白,什么都想不起来了"
#使用自定义字典
#jieba.load_userdict('dict.txt')

ex_list1 = jieba.cut(str)
ex_list2 = jieba.cut(str , cut_all= True)
ex_list3 = jieba.cut_for_search(str)
print("精准模式:"+'/'.join(ex_list1))
print("全模式:"+'/'.join(ex_list2))
print("搜索引擎模式:"+'/'.join(ex_list3))
精准模式:明明/知识点/都/熟记/于心/,/可是/在/考试/的/时候/脑子/一片空白/,/什么/都/想不起来/了
全模式:明明/明知/知识/知识点/都/熟记/于/心///可是/在/考试/的/时候/脑子/一片/一片空白/空白///什么/都/想不起/想不起来/起来/了
搜索引擎模式:明明/
好的,我可以为您讲解如何使用Pythonwordcloudjieba制作中文词云图。 首先,您需要安装以下库:wordcloudjieba 和 matplotlib。您可以使用以下命令进行安装: ``` pip install wordcloud pip install jieba pip install matplotlib ``` 接着,您需要准备一段中文文本。您可以从网络上下载一些中文文章,或者自己写一些中文文本。 然后,您可以使用jieba库将中文文本进行分jieba库提供了一个基于前缀典实现的中文器,可以将中文文本分成一个个语。下面是一个使用jieba库进行中文的示例代码: ```python import jieba # 设置停用文件路径 jieba.analyse.set_stop_words("stopwords.txt") # 读取文本文件 with open("text.txt", "r", encoding="utf-8") as f: text = f.read() # 对文本进行分 words = jieba.cut(text) # 输出分结果 print(",".join(words)) ``` 在上面的代码中,我们使用了一个停用文件来过滤掉一些无意义的语。您可以自己准备一个停用文件,也可以使用别人已经准备好的停用文件。 接下来,您可以使用wordcloud生成词云图wordcloud库提供了一个WordCloud类,可以根据语频率生成词云图。下面是一个使用wordcloud生成词云图的示例代码: ```python import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 设置停用文件路径 jieba.analyse.set_stop_words("stopwords.txt") # 读取文本文件 with open("text.txt", "r", encoding="utf-8") as f: text = f.read() # 对文本进行分 words = jieba.cut(text) # 生成语频率字典 word_freq = {} for word in words: if word not in word_freq: word_freq[word] = 0 word_freq[word] += 1 # 生成词云图 wc = WordCloud(font_path="simhei.ttf", background_color="white") wc.generate_from_frequencies(word_freq) # 显示词云图 plt.imshow(wc, interpolation="bilinear") plt.axis("off") plt.show() ``` 在上面的代码中,我们使用了一个字体文件来设置词云图的字体。您可以自己选择一个中文字体文件,也可以使用别人已经准备好的字体文件。 最后,您可以使用matplotlib库将词云图显示出来。使用plt.imshow()函数可以显示图像,使用plt.axis("off")函数可以去掉坐标轴,使用plt.show()函数可以显示图像。 希望以上内容能够帮助到您制作中文词云图
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值