Python 调用jieba进行分词

最新推荐文章于 2024-01-24 10:44:15 发布

原创最新推荐文章于 2024-01-24 10:44:15 发布 · 833 阅读

0 ·

CC 4.0 BY-SA版权

Python 同时被 2 个专栏收录

11 篇文章

订阅专栏

机器学习

7 篇文章

订阅专栏

本文介绍了如何使用Python的jieba库进行中文分词，并通过一个实际例子展示了从安装到使用的全过程。包括安装方法、验证安装步骤及对文本进行分词处理的代码实现。

部署运行你感兴趣的模型镜像

1. 首先安装jieba库，我用的Python3.5，所以sudo pip3 install jieba进行安装

2. 检测安装是否成功

zhangqi@ThinkPad-X250:~$ python3.5
Python 3.5.2 (default, Nov 12 2018, 13:43:14) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import jieba
>>>

3. 准备一篇文章，

#!/usr/bin/python3.5

import jieba

if '__main__' == __name__:
    with open ("春.txt") as fp:
        text = fp.read()
        
    words = [w for w in jieba.cut(text)]
    print(words)

您可能感兴趣的与本文相关的镜像