import jieba
txt=open("我的26岁女房客.txt",'r',encoding="utf-8").read()
exclude = {"没有", "什么", "我们", "自己", "说道", "一个", "这个", "已经", "这么", "因为", "事情", "问道", "知道",
"终于", "现在", "真的", "看着", "然后",'只是','不是','可以','有些','所以','怎么','还是','女人','就是','一起','之后'
,'他们','生活','觉得','如果','点头','不会','可是','时候','笑了笑','你们','那个','一定','心中','这些','电话','不能','沉默','起来'
,'公司','今天','身边','一直','那么','看到','于是','一些','时间','希望','这样','离开','这种','苏州','告诉','还有','卓美','出来'
,'工作','下来','感觉','愿意','好似','那些'}
words=jieba.lcut(txt)
count={}
for word in words:
if len(word)==1:
continue
else:
count[word]=count.get(word,0)+1
for word in exclude:
del count[word]
lis=list(count.items())
lis.sort(key=lambda x:x[1],reverse=True)
for i in range(8):
print(lis[i][0])
jieba库实例
最新推荐文章于 2024-10-16 16:05:45 发布