使用Python读取一个文本文件并计算其中每个单词出现的次数

编程初学者01

于 2024-03-20 15:00:07 发布

阅读量1.5k

点赞数 7

分类专栏： Python 文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_67587248/article/details/136876909

版权

Python 专栏收录该内容

6 篇文章

订阅专栏

本文展示了如何使用Python中的re模块和matplotlib库对《哈姆雷特》文本进行单词频率分析，提取并可视化了最常见的10个单词及其出现次数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import re
import matplotlib.pyplot as plt
from collections import Counter
word_counts = {}
with open('E:\自然语言处理\Hamlet(2).txt') as f:
    for line in f:
        words = line.strip().lower().split()
        for word in words:
            word = re.sub(r'[^a-zA-Z]+','',word)
            if word in word_counts:
                word_counts[word] += 1
            else:
                word_counts[word] = 1
top_words = Counter(word_counts).most_common(10)
top_words_list = [word[0] for word in top_words]
top_words_counts = [word[1] for word in top_words]
plt.bar(top_words_list, top_words_counts)
plt.xlabel('单词')
plt.ylabel('出现次数')
plt.title('前10个出现次数最多的单词')
plt.xticks(rotation=45)
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定使用中文字体
for i, count in enumerate(top_words_counts):
    plt.text(i, count, str(count), ha='center', va='bottom')
plt.show()
print(word_counts)

我们假设我们获取了一个哈姆雷特文本，要进行每个单词的统计

编程初学者01

博客等级

码龄3年

88
原创

254
点赞

319
收藏

804
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

@Controller爆红
2301_78303685: 感谢，问题解决了
算法设计与分析之最优二叉搜索树
清谈饱，梦想生: up主m[i + 1][i] = 0和m[i+1][i] = a[i]会不会导致结果不同，你了解它们的区别吗，比如什么时候用
神经网络：手写数字图像识别
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
神经网络：手写数字图像识别
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【ssmp】springboot综合开发——图书管理系统【CRUD】
为什么学it为什么学it: 哥，求求私信一下源码谢谢！！！！1

大家在看

你有没想过如果将你本身的能力放大会怎么样? 326

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

编程初学者01 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。