怎么用Python做词云
在数据可视化领域,词云已经成为了比较流行的一种展示方式,简单而直观地传达着数据的重点和特点。Python是一门广泛应用于数据分析和可视化的编程语言,其强大的文本处理能力和第三方库的支持,使得使用Python做词云十分方便。本文将从数据准备到词云生成,介绍如何使用Python做词云。
数据准备
在做词云之前,需要准备好要展示的文本数据。通常词云所需的文本数据都是一些无格式或半结构化的数据,譬如新闻标题,微博评论等。对于国内的读者,可以使用爬虫获取相关文本数据,Python中有诸多优秀的爬虫框架,如Scrapy,BeautifulSoup等。在得到文本数据后,可以使用Python自带的字符串方法进行文本预处理,如去除标点符号,转换为小写等。
以下我们以一则新闻标题为例:
title = "特朗普辞职后,美国政府还能不能发布新冠病毒防控计划?"
词频统计
在得到预处理好的文本数据后,下一步需要做的是统计每个单词的出现频率。Python中有多个第三方库可以用于统计,我们这里以collections库为例。
import collections
words_count = collections.Counter(title.split())
以上代码中,使用split()方法将字符串按空格分割为单词列表,然后使用collections.Counter方法计算每个单词的出现频率。我们可以输出统计结果来进行检查。
>>> words_count
Counter({'特朗普辞职后,美国政府还能不能发布新冠病毒防控计划?': 1})
可以看到,由于我们只统计了一个新闻标题,所以输出的结果中只有一个元素,即这个标题本身。在实际使用中,需要统计多篇文本的词频并将其合并,通常使用pandas库进行数据整合。
生成词云
获得词频统计结果后,下一步需要做的是将其转化为词云所需的格式。对于一般的词云生成工具,需要将每个单词的名称和频率以字典的形式传递给词云生成器。幸运的是,Python中的wordcloud库封装了这些操作,只需按照格式传递数据即可。
from wordcloud import WordCloud
wc = WordCloud(
width=800,
height=600,
max_words=100,
background_color='white',
font_path='msyh.ttc',
contour_width=3,
contour_color='steelblue'
)
wc.generate_from_frequencies(words_count)
以上代码创建了一个800x600的词云对象,设定了最多显示100个单词,背景颜色为白色,字体为微软雅黑,轮廓宽度为3,颜色为铁青色。使用generate_from_frequencies()方法加载词频数据。最后,我们可以输出词云图片并保存。
import matplotlib.pyplot as plt
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()
wc.to_file('wordcloud.png')
以上代码将词云图片以矩阵的形式显示出来,并将其保存为wordcloud.png文件。
结论
使用Python做词云,不仅方便简单,而且还拥有良好的可扩展性,可以进行自定义设置以及进一步的数据处理和分析。需要注意的是,生成的词云不应该成为唯一的数据展示方式,尤其是需要呈现多方面的数据时,一定要结合其他图表或者数据解释一起使用,以确保数据的准确传达和解读。
最后的最后
本文由chatgpt生成,文章没有在chatgpt
生成的基础上进行任何的修改。以上只是chatgpt
能力的冰山一角。作为通用的Aigc
大模型,只是展现它原本的实力。
对于颠覆工作方式的ChatGPT
,应该选择拥抱而不是抗拒,未来属于“会用”AI的人。
🧡AI职场汇报智能办公文案写作效率提升教程 🧡 专注于AI+职场+办公
方向。
下图是课程的整体大纲
下图是AI职场汇报智能办公文案写作效率提升教程
中用到的ai工具
🚀 优质教程分享 🚀
- 🎄可以学习更多的关于人工只能/Python的相关内容哦!直接点击下面颜色字体就可以跳转啦!
学习路线指引(点击解锁) | 知识定位 | 人群定位 |
---|---|---|
🧡 AI职场汇报智能办公文案写作效率提升教程 🧡 | 进阶级 | 本课程是AI+职场+办公的完美结合,通过ChatGPT文本创作,一键生成办公文案,结合AI智能写作,轻松搞定多场景文案写作。智能美化PPT,用AI为职场汇报加速。AI神器联动,十倍提升视频创作效率 |
💛Python量化交易实战 💛 | 入门级 | 手把手带你打造一个易扩展、更安全、效率更高的量化交易系统 |
🧡 Python实战微信订餐小程序 🧡 | 进阶级 | 本课程是python flask+微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一个全栈订餐系统。 |