Python实现《红楼梦》中贾宝玉与十二金钗关系图谱

cnn-jxx

于 2024-03-14 18:50:08 发布

阅读量973

点赞数 11

文章标签： python 中文分词

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/csdnjxx/article/details/136718802

版权

这段代码的整体功能是从一个红楼梦文本文件中利用python的jieba分词库通过算法提取人名，分析这些人名在文本中的出现频率以及他们之间的关联关系，然后将这些信息输出到两个文件中，并最终在控制台上以prettytable表格的形式展示关系信息。下面我会详细解释每个部分的工作原理：

导入必要的库

codecs：用于读取和写入文件，支持多种编码方式。
jieba：中文分词工具。
jieba.posseg：用于词性标注的分词工具。
PrettyTable：用于创建漂亮的表格输出。

定义相关变量

names：一个字典，用于存储每个人名及其出现的次数。
relationships：一个字典，用于存储人名之间的关联关系及其次数。
line_names：一个列表，用于存储每一行文本中识别出的人名。

加载任务表和分词

使用jieba.load_userdict("./names.txt")加载用户自定义词典，这里假设names.txt包含了一些人名。
读取hlm.txt文件，对每一行进行分词和词性标注。
如果一个词的词性为nr（人名）且长度大于或等于2，则将其添加到line_names列表，并更新names和relationships

最低0.47元/天解锁文章

博客等级

码龄3年

21
原创

240
点赞

174
收藏

172
粉丝

关注

私信

热门文章

分类专栏

分类模型的sklearn实现 8篇
机器学习课程笔记 4篇

展开全部收起

最新评论

利用运动手环数据预测身体姿态
cnn-jxx: 抱歉，这个是我们老师给我们的数据，说是小米手环采集的。
利用运动手环数据预测身体姿态
m0_63220458: 请问一下数据是怎么采集的呢，用的哪一款智能手环呢？
使用朴素贝叶斯分类对二手房数据集进行分类
小细腿.: 大佬…想了解一下这个程序
用梯度下降法实现线性回归
优快云-Ada助手: 恭喜您写了这篇关于用梯度下降法实现线性回归的博客！不仅内容深入浅出，而且对于这一复杂主题的解释非常清晰易懂。希望您能继续保持创作的热情，探索更多深入的机器学习算法，并结合实际案例进行分析。或许下一步可以考虑写一篇关于使用正则化方法优化线性回归模型的文章，期待您的精彩分享！
利用逻辑回归模型预测贷款违约行为
优快云-Ada助手: 恭喜作者撰写了这篇有趣且实用的博客！利用逻辑回归模型预测贷款违约行为是一个非常有意义的课题，希望作者可以继续深入挖掘相关内容，比如可以尝试探讨不同特征对贷款违约的影响，或者尝试使用其他机器学习算法进行比较分析。期待作者的下一篇作品！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。