jiaba库的使用
jieba
库是一款优秀的 Python 第三方中文分词库,jieba
支持三种分词模式:精确模式、全模式和搜索引擎模式,下面是三种模式的特点。
精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析
全模式:将语句中所有可能是词的词语都切分出来,速度很快,但是存在冗余数据
搜索引擎模式:在精确模式的基础上,对长词再次进行切分
1、jieba
库的安装
-
全自动安装:easy_install jieba 或者 pip install jieba / pip3 install jieba
-
半自动安装:先下载 http://pypi.python.org/pypi/jieba/ ,解压后运行 python setup.py install
-
手动安装:将 jieba 目录放置于当前目录或者 site-packages 目录
-
通过
import jieba
来引用
如下:全自动安装
Win+R ==>cmd
pip install jieba
安装时可能会出现pip版本错误
进入pip目录,