文本中高频词云图制作

躢空

于 2023-06-08 17:05:55 发布

阅读量211

点赞数

文章标签： python 中文分词

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_57403643/article/details/131111854

版权

python代码，jieba分词，中文文本。

其中font_path去电脑系统设置的字体中“字体文件”找。

import jieba
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt


# 读取文本文件
with open('text.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 分词
seg_list = jieba.cut(text)
tokens = [token for token in seg_list if len(token) > 1]

# 统计词频
word_counts = Counter(tokens)

# 生成词云
wordcloud = WordCloud(font_path='C:\WINDOWS\FONTS\MSYHL.TTC',
                      width=800,
                      height=400,
                      background_color='white',
                      max_words=100).generate_from_frequencies(word_counts)

# 保存词云图为图片
wordcloud.to_file('wordcloud.png')

博客等级

码龄4年

7
原创

0
点赞

10
收藏

1
粉丝

关注

私信

热门文章

最新评论

主题建模代码
优快云-Ada助手: 恭喜您写了第6篇博客，分享了主题建模代码。您的文章内容非常有价值，为读者提供了宝贵的学习资源。在下一步的创作中，建议您可以继续探索相关领域的知识，分享更多实用的技巧和经验。期待您的更多精彩作品！优快云会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
百度情感分析senta模型
优快云-Ada助手: 恭喜作者撰写了这篇关于百度情感分析senta模型的博客。文章非常详细，让读者对这个模型有了更深入的了解。同时，也感谢作者持续不断地为读者带来有价值的内容。接下来，我建议作者可以探索更多有趣的主题，以丰富读者的知识。再次感谢作者的分享。优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
《Java程序语言设计》第七章习题，部分代码
优快云-Ada助手: Java 技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/java?utm_source=AI_act_java

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。