统计文章内词频率

最新推荐文章于 2024-06-11 00:15:00 发布

心心强

最新推荐文章于 2024-06-11 00:15:00 发布

阅读量268

点赞数

分类专栏： python 基础实战

本文链接：https://blog.youkuaiyun.com/u010708028/article/details/105430521

版权

python 基础同时被 2 个专栏收录

20 篇文章

订阅专栏

实战

12 篇文章

订阅专栏

本篇博客介绍了一种使用Python的collections模块中的Counter函数来统计英文文学作品《罗密欧与朱丽叶》中各单词出现频率的方法。通过读取文本文件，将文本转换为单词列表，并应用Counter函数，最终输出指定单词的出现次数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import collections
target_str="THE TRAGEDY OF ROMEO AND JULIET"

with open('./罗密欧与朱丽叶(英文版)莎士比亚.txt', encoding='utf-8') as file:
    txts=file.read()
    #用 split 将单词利用空格切分开 将文本文件变成单词的列表
    danci=txts.split()
    #利用 Counter 函数统计词频 用字典的形式排序好了再输出
    m=collections.Counter(danci)
    #print(m)
    print(m.get('the'))