python手撸代码获取小说人名

本文介绍了一种通过手写代码实现的小说文本处理工具,无需外部分词库,直接从小说路径文件中截取并统计人名频率,生成按顺序排列的人员名单,提供给不熟悉Python环境的新手使用,可从Gitee码云下载完整文件包。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

通过手写代码,输入一本小说的路径文件,对小说文本段落预处理,然后截取叙述的段落,统计前面词语出现的频率,如果是小说中的人名,一定会高频出现,并且剔除掉其他无关字,实现筛选出一本小说中的人名。

这个代码,没有依赖其他的分词库之类的,纯粹地截取字频去统计。

由于代码太长,所以打包成了exe文件,没有python环境的新手,也可以使用。

这个项目文件也同时上传到gitee码云上面,需要的可以去下载 。一定要下载整个文件夹,配合exe文件使用的。

码云:GetPnoname: 一个获取小说人名的软件

筛选出来的人名,同时也会按照在小说中出现的顺序排序。

筛选出来的结果,就像下面这样,放在输出文件夹里。

冯子才
楚强
楚威龙
程雄
方宏信
刘雪梅
崔亮
梁坤
崔岩峰
程英
雷老虎
杨九
黄管家
孙东明
杨建业
刘敏
张媚
郝强
尹秀
田秋
钱明昌
刘云峰
杜建筑
赵洪光
苏明武
何宏盛
王裘
钱思礼
天哥
张天
侯百川

这是软件的整个界面

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值