思路:
1.通过jieba库分词获取所有的词语列表;
2.计算列表里出现词语及其对应的频次,存储为字典;
3.删除字典中键为无关且频次高的词语的键值对;
4.对字典里的词语按照频次进行排序;
5.输出频次前五的词语及其频次;
如果没有安装 jieba 库,需要使用 cmd 进入命令提示符窗口,通过 pip install jieba 进行安装。
源代码如下
import jieba
file = open("sample.txt", "r", encoding='utf-8')
txt = file