1. 首先安装jieba库,我用的Python3.5,所以sudo pip3 install jieba进行安装
2. 检测安装是否成功
zhangqi@ThinkPad-X250:~$ python3.5
Python 3.5.2 (default, Nov 12 2018, 13:43:14)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import jieba
>>>
3. 准备一篇文章,
#!/usr/bin/python3.5
import jieba
if '__main__' == __name__:
with open ("春.txt") as fp:
text = fp.read()
words = [w for w in jieba.cut(text)]
print(words)

本文介绍了如何使用Python的jieba库进行中文分词,并通过一个实际例子展示了从安装到使用的全过程。包括安装方法、验证安装步骤及对文本进行分词处理的代码实现。
1307

被折叠的 条评论
为什么被折叠?



