HanLP是由何晗 @hankcs 开发的一个自然语言处理开源包,使用它可以完成中文分词、词性标注、命名实体识别、句法分析、文本分类等任务。
HanLP本身是用java语言写的,github上虽然给出的是“pip install hanlp”的安装和使用方法,但我这个编程菜鸟实测用不了。
要在Python里使用HanLP,可以安装pyhanlp
一、Pyhanlp安装
命令行安装指令:
pip install pyhanlp
二、java jdk-8安装
但是,仅安装pyhanlp还无法使用pyhanlp,由于pyhanlp是通过python接口调用java包,所以要使用它,你还需要安装java jdk
Oracle官网可以免费下载安装 java jdk-8, 但是需要账号登录。而现在注册oracle账号是一件非常麻烦的事情。
幸好,网上有好心人分享了oracle的账号,可以用来下载java JDK.

本文详细介绍了如何安装和使用HanLP及其Python接口PyHanLP进行中文自然语言处理,包括分词、词性标注等任务。从Java JDK安装、环境变量配置到PyHanLP的具体使用教程,为初学者提供了全面的指导。
最低0.47元/天 解锁文章
1162

被折叠的 条评论
为什么被折叠?



