hanlp 安装、报错及解决方式、体验

介绍

面向生产环境的多语种自然语言处理工具包,基于 TensorFlow 2.0,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版。目前,基于深度学习的HanLP 2.0正处于alpha测试阶段,未来将实现知识图谱、问答系统、自动摘要、文本语义相似度、指代消解、三元组抽取、实体链接等功能。欢迎加入蝴蝶效应参与讨论,或者反馈bug和功能请求到issue区。Java用户请使用1.x分支 ,经典稳定,永久维护。RESTful API正在开发中,2.0正式版将支持包括Java、Python在内的开发语言。

关键词

中文分词 词性标注 命名实体识别 依存句法分析 语义依存分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理

安装 hanlp

 pip install hanlp

报错及解决方案

Q: RuntimeError: Unsupported compiler – at least C++0x support is needed!
A:

yum install -y gcc-c++ 

Q: < Python.h > :没有那个文件或目录
A:

yum install -y  python3-devel

体验

第一个例子

分词(中文分词、中文斷詞、英文分词、任意语种分词)
作为终端用户,第一步需要从磁盘或网络加载预训练模型。比如,此处用两行代码加载一个名为 PKU_NAME_MERGED_SIX_MONTHS_CONVSEG 的分词模型。

一旦模型下载完毕,即可将tokenizer当成一个函数调用:

import hanlp
tokenizer = hanlp.load('PKU_NAME_MERGED_SIX_MONTHS_CONVSEG')
print(tokenizer('商品和服务'))

结果:
在这里插入图片描述

词性标注

词性标注器的输入是单词,输出是每个单词的词性标签。

import hanlp
# 分词
# tokenizer = hanlp.load('PKU_NAME_MERGED_SIX_MONTHS_CONVSEG')
# print(tokenizer('商品和服务'))
# 词性标注
# 词性标注器的输入是单词,输出是每个单词的词性标签。
tagger = hanlp.load(hanlp.pretrained.pos.CTB5_POS_RNN_FASTTEXT_ZH)
print(tagger(['我', '的', '希望', '是', '希望', '和平']))

运行结果:
在这里插入图片描述

hanlp安装报错"ERROR: Could not build wheels for jpype1, which is required to install pyproject.toml-based projects"可能是由于缺少jpype1库的编译环境导致的。为了解决这个问题,可以尝试以下方法: 1. 确保你已经安装了Microsoft Visual C++ 14.0或更高版本。这是编译jpype1库所需的编译器。你可以从Microsoft官方网站上下载安装Visual Studio Community版本。 2. 如果你已经安装了Visual Studio但问题仍然存在,可以尝试运行Visual Studio的"Developer Command Prompt",然后在命令提示符下重新运行hanlp安装命令。这将确保你使用的是正确的编译环境。 3. 确保你的操作系统和Python版本与jpype1库的要求相匹配。有些库可能只支持特定的操作系统和Python版本。你可以查看jpype1库的文档或官方网站,了解它的要求。 4. 如果以上方法都无效,你可以尝试使用预编译的二进制文件安装jpype1库。有些库提供了预编译的二进制文件,可以直接安装而无需编译。你可以从jpype1库的官方网站或第三方资源站点上寻找并下载预编译的二进制文件,然后按照说明进行安装。 希望这些方法能帮助你解决hanlp安装报错的问题。如果问题仍然存在,请提供更多的错误信息或尝试搜索相关的解决方案。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [ERROR: Could not build wheels for XXX, which is required to install pyproject.toml-based projects](https://blog.youkuaiyun.com/longe20111104/article/details/131332169)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [lanms-neo-1.0.2-cp38-cp38-win-amd64.whl](https://download.youkuaiyun.com/download/sayonekui/87429886)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值