python 文章词数统计

最新推荐文章于 2024-06-06 22:28:42 发布

ItisNagatoYuki

最新推荐文章于 2024-06-06 22:28:42 发布

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/qq_35899407/article/details/97798979

本文介绍了一种使用Python进行英文文本统计的方法，通过正则表达式分割文本为单词列表，并利用Counter类统计各单词出现频率，最后输出频率最高的三个单词。

# -*- coding: utf-8 -*-
# by dl
import re
from collections import Counter
txt = open('english.txt').read()
print(txt)
# 以非字母的字符串分割成 list
txtRe = re.split('\W+', txt)
print(txtRe)
# 这里就对每一个词进行了统计
c3 = Counter(txtRe)
print(c3)
# 找出频率最高的三个 如果有相同的则会忽略后面的
print(c3.most_common(3))