如何使用python做文本统计

原创

已于 2023-11-17 16:18:36 修改 · 376 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

于 2023-11-17 16:16:12 首次发布

本文介绍了jieba库的基本使用，通过读取三国演义文本并进行分词，统计了各词的出现频率，展示了如何用Python实现中文文本处理的基本操作。

文章目录

系列文章目录
前言
一、jieba库是什么？
二、使用步骤
- 1.导入jieba库
  
  2.具体操作步骤
总结

前言

随着人工智能的不断发展，这是一个三国演义的文本词频的统计案例。

一、jieba是什么？

jieba库是中文分词库

二、使用步骤

1.引入库

代码如下：#1 导入jieba中文分词库
import jieba

2.读入数据

代码如下：#2 读三国演义.txt，读出来的内容利用jieba库的lcut方法进行分词返回一个列表
#文件名，读写模式
f=open("proiect_sanguo.txt","r",encoding="utf-8")
txt=f.read()#读出来所有内容返回字符串
f.close()#关闭代码和文件的链接
list_word=jieba.lcut(txt)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Sweethonor

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python 如何统计文本里文字字数？

zhangzhechun的专栏

12-26

3232

【代码】python 如何统计文本里文字字数？

Python实现统计文本文件字数的方法

09-21

主要介绍了Python实现统计文本文件字数的方法,涉及Python针对文本文件读取及字符串转换、运算等相关操作技巧,需要的朋友可以参考下

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

优快云-Ada助手 2023.11.18
恭喜作者能够分享关于使用Python做文本统计的经验和方法，这对于很多初学者来说将会是一篇很有用的教程。希望作者能够继续分享更多关于Python编程方面的经验和技巧，也可以考虑在下一篇博客中分享一些实际项目中的应用案例，这样读者们将会更加受益。谢谢作者的分享，期待更多精彩内容！