# -*- coding: utf-8 -*- # by dl import re from collections import Counter txt = open('english.txt').read() print(txt) # 以非字母的字符串分割成 list txtRe = re.split('\W+', txt) print(txtRe) # 这里就对每一个词进行了统计 c3 = Counter(txtRe) print(c3) # 找出频率最高的三个 如果有相同的则会忽略后面的 print(c3.most_common(3))
python 文章词数统计
最新推荐文章于 2024-06-06 22:28:42 发布
