前文Python 结巴(jieba)库之花拳绣腿结巴(jieba)为优秀的中文分词第三方库
https://blog.youkuaiyun.com/iprobobo/article/details/122686102业已指出,结巴(jieba)为优秀的中文分词库,功能强大,今天就拿《三国演义》来小试牛刀。
《三国演义》为中国文学史上的第一部章回小说,是历史演义小说的开山之作,中国古典四大名著之一。明清时期甚至有“第一才子书”之称。其描写了从东汉末年到西晋初年之间近百年的历史风云,诉说了魏、蜀、吴三国之间的政治和军事斗争等故事,塑造了一群叱咤风云的三国英雄人物。虽说英雄不问出处,但其出场秀还是值得研究一番的。
二话不说,上代码:
import jieba
txt=open('三国演义.txt','r',encoding='utf-8').read()
words=jieba.lcut(txt)
count={}
for word in words:
if len(word)==

本文通过Python的jieba库对《三国演义》进行中文分词,展示了jieba在处理古典文学作品中的应用,并探讨了jieba在词频统计上的局限性,提出需要进一步优化。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



