【Python】使用jieba统计三国演义人物出场次数

少吃零食多运动

已于 2025-01-20 16:52:10 修改

阅读量287

点赞数 6

文章标签： python

于 2025-01-20 16:51:03 首次发布

本文链接：https://blog.youkuaiyun.com/snowzmy/article/details/145265220

版权

threekingdoms.txt见附件。不知道上传成功没，第一次用。
中文文本需要通过分词获得单个的词语。
jieba是优秀的中文分词第三方库，需要额外安装：pip install jieba
jieba分词的三种模式:

精确模式：把文本精确的切分开，不存在冗余单词。
全模式：把文本中所有可能的词语都扫描出来，有冗余。
搜索引擎模式：在精确模式基础上，对长词再次切分。

函数	描述	举例	结果
jieba.lcut(s)	精确模式，返回一个列表类型	>>>jieba.lcut(“中国是一个伟大的国家”)	[‘中国’, ‘是’, ‘一个’, ‘伟大’, ‘的’, ‘国家’]
jieba.lcut(s, cut_all=True)	全模式，返回一个列表类型的分词结果，存在冗余	>>>jieba.lcut(“中国是一个伟大的国家”,cut_all=True)	[‘中国’, ‘国是’, ‘一个’, ‘伟大’, ‘的’, ‘国家’]
jieba.lcut_for_search(s)	搜索引擎模式，返回一个列表类型的分词结果，存在冗余	>>>jieba.lcut_for_search(“中华人民共和国是伟大的")	[‘中华’, ‘华人’, ‘人民’, ‘共和’, ‘共和国’, ‘中华人民共和国’, ‘是’, ‘伟大’, ‘的’]
jieba.add_word(w)	向分词词典增加新词w	>>>jieba.add_word(“蟒蛇语言”)

首先使用jieba.lcut()函数对文档进行分词，返回列表。

#CalThreeKingdomsV2.py
import jieba
txt = open

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

少吃零食多运动

关注关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python三国演义人物统计分析_使用python统计《三国演义》小说里人物出现次数前十名，并实现可视化。...

weixin_39734493的博客

11-30

4223

《三国演义》.txt下载地址(提取码：kist )使用pycharm安装库打开Pycharm选择【File】下的Settings出现下面页面,选择右边的【+】出现下面页面，在此页面顶端搜索想要的库，然后安装就可以了二、编写代码import一、安装所需要的第三方库jieba (jieba是优秀的中文分词第三分库)pyecharts (一个优秀的数据可视化库)《三国演义》.txt下载地址(提取码：ki...

【python学习】如何用函数统计三国演义中角色出现的次数，学习并使用了新的调用方法

ya的博客

07-10

662

用函数统计三国演义中人物出现的次数，并按次数从多到少排列。

参与评论您还未登录，请先登录后发表或查看评论

python统计三国演义中人物出现的频次

呆萌小新@渊洁的博客

11-12

7585

【代码】python统计三国演义中人物出现的频次。

Python/python实战： jieba库的运用，统计三国演义中人物的出场次数、频率

wen的博客

04-21

1249

Python/python实战： jieba库的运用，统计三国演义中人物的出场次数、频率

Python实现《三国演义》人物出场次数统计

weixin_44517249的博客

03-01

1383

使用Python的第三方库jieba库实现《三国演义》人物出场次数Top20统计

python三国演义人物统计分析_python统计三国演义人物出场次数

weixin_39838758的博客

11-27

1171

[Python] 纯文本查看复制代码import jiebaexcludes = {"将军", "却说", "荆州", "二人", "不可", "不能", "如此", "商议", "如何", "主公","军士", "左右", "军马", "引兵", "次日", "大喜", "天下", "东吴", "于是", "今日","不敢", "魏兵","人马", "陛下", "一人", "不知", "汉中"...

python三国演义人物出场统计

热门推荐

csdn_kou的博客

11-11

1万+

完整代码开源代码统计三国演义人物高频次数 #!/usr/bin/env python # coding=utf-8 #e10.4CalThreeKingdoms.py import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此&q

python三国演义人物出场统计ppt_Python统计三国演义主要人物出场次数

weixin_39830688的博客

12-28

931

import jieba#读取三国演义with open("三国演义.txt",'r',encoding='utf-8') as f:txt= f.read()#进行中文分词words=jieba.lcut(txt)#利用停用词表剔除语气词等等afterw=[]with open("tingyongcibiao.txt",'r',encoding='utf-8') as fp:tycb=fp.re...

使用python统计《三国演义》人物词频，看看罗贯中笔下谁的出场次数最多

快乐星球

05-18

1万+

使用分词算法统计《三国演义》人物词频，看看谁是罗贯中心中最靓的仔。谁才是《三国演义》中出场次数最多的人。重新优化的其他案例的统计逻辑

python三国演义人物统计分析前20个_python爬取三国演义文本，统计三国演义中出场次数前30的人物，并生成词云、图表...

weixin_28805935的博客

12-28

3046

目录1.目标2.码前须知3.操作流程4.完整代码5.总结1.目标python爬取三国演义，生成词云、图表2.码前须知项目目标：三国人物名称及出现次数-----数据统计分析提出问题：哪个人物在三国演义中出现的次数最多？，我们希望通过数据分析来获得答案。分析工具：pandas,Matplotlibpip install bs4pip install lxmlpip install pandaspip ...

python三国演义人物统计分析前20个_使用python统计《三国演义》小说里人物出现次数前十名，并实现可视化。...

weixin_31190007的博客

12-28

4132

一、安装所需要的第三方库jieba (jieba是优秀的中文分词第三分库)pyecharts (一个优秀的数据可视化库)《三国演义》.txt下载地址(提取码：kist )使用pycharm安装库打开Pycharm选择【File】下的Settings出现下面页面,选择右边的【+】出现下面页面，在此页面顶端搜索想要的库，然后安装就可以了二、编写代码import jieba #导入库import os...

Python_leve2.1

最新发布

m0_65273147的博客

05-04

509

系统介绍: 本系统是一个分数查询系统，通过输入学生姓名，可以在控制台输出对应学生的成绩。拓展功能: 可以为系统添加增加、删除、修改学生成绩信息等功能。实现方法: 利用字典的增删改操作，结合用户输入，实现更多功能。举例: 同学们可以根据所学知识，自行对系统进行拓展，如添加新学生成绩、删除已有学生成绩、修改学生成绩等。

【记录】Python调用大模型（以Deepseek和Qwen为例）

weixin_44194088的博客

04-29

712

预备（以BERTopic聚合主题为例）

【锂电池剩余寿命预测】RF随机森林锂电池剩余寿命预测（Pytorch完整源码和数据）

机器学习之心的博客，关注并私信文章链接，获取对应文章源码和数据。

05-04

【锂电池剩余寿命预测】RF随机森林锂电池剩余寿命预测（Pytorch完整源码和数据）

Python项目--基于计算机视觉的手势识别控制系统

exlink2012的专栏

04-23

3742

随着人机交互技术的快速发展，传统的键盘、鼠标等输入设备已经不能满足人们对自然、直观交互的需求。手势识别作为一种非接触式的人机交互方式，具有操作自然、交互直观的特点，在智能家居、游戏控制、虚拟现实等领域有着广泛的应用前景。本项目旨在开发一个基于计算机视觉的手势识别控制系统，通过摄像头捕获用户的手部动作，实时识别手势类型，并将识别结果转化为相应的控制命令，实现对计算机或其他设备的非接触式控制。

详细介绍Python-pandas-DataFrame全部 *功能* 函数

mobangde的博客

05-01

1242

详细介绍Python-pandas-DataFrame全部功能函数。拿着API复制的全部功能函数。然后写了案例代码。另外的统计函数及其他操作，文章里有链接

python3调用某个路径下的方法超级详解

数据知道的博客

04-30

454

通过以上方法，您可以灵活地在Python项目中调用任意路径下的方法，同时保证代码的安全性和可维护性。原理：Python在导入模块时会搜索sys.path中的路径，通过临时添加路径可以实现模块导入。在Python中，调用特定路径下的方法涉及模块导入和路径处理。原理：importlib提供了更灵活的模块导入机制，可以直接从文件路径导入模块。原理：直接读取文件内容并执行，相当于将文件内容插入当前上下文。• 将导入语句放在函数/方法内部。注意：需要将项目作为包运行（

关于Python：7. Python数据库操作

Triste__chengxi的博客

05-03

1377

简化数据库操作：SQLAlchemy ORM 提供了高层次的接口来简化数据库的操作，我们可以通过 Python 类来表示数据库表，进行增删改查，避免了手写 SQL 语句。支持复杂查询：SQLAlchemy 支持排序、聚合、联接查询等复杂数据库操作，同时可以自动生成对应的 SQL 语句。跨数据库兼容性：通过 SQLAlchemy，你可以很容易地将项目从一个数据库迁移到另一个数据库（比如从 SQLite 到 MySQL、PostgreSQL）。

load_dotenv()详解

kingdom_java的博客

05-04

633

load_dotenv()` 是连接 `.env` 文件与 Python 运行时环境的核心工具，通过动态加载配置实现安全、灵活的多环境管理。其设计兼顾开发便捷性与生产环境适配性，是现代 Python 项目的标配。

在python中请用jieba完成统计三国演义人物的出场次数

04-23

接下来，你可以使用以下代码进行统计人物出场次数： ```python import jieba # 读取文件内容 with open('sgyy.txt', 'r', encoding='utf-8') as f: sgyy = f.read() # 使用jieba分词 words = jieba.lcut(sgyy) ...