文本放在与代码同目录下
import jieba
txt=open("西游记.txt", "r", encoding='utf-8').read()
words=jieba.lcut(txt)
counts={}
for word in words:
if len(word) ==1:
continue
else:
counts[word]=counts.get(word,0)+1
it=list(counts.items())
it.sort(key=lambda x:x[1],reverse=True)
for i in range(20):
word, count =it[i]
print("{0:<10}{1:>5}".format(word, count))
运行结果:
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\Linrs\AppData\Local\Temp\jieba.cache
Loading model cost 0.726 seconds.
Prefix dict has been built successfully.
行者 4086
八戒 1704
师父 1608
三藏 1335
一个 1143
大圣 901
唐僧 837
那里 777
怎么 756
菩萨 752
沙僧 735
我们 726
不知 676
和尚 664
妖精 635
两个 612
甚么 553
这里 525
不是 515
长老 512
824

被折叠的 条评论
为什么被折叠?



