NLP入门工具hanlp就好——python版本和java版本安装提示

HanLP安装与使用指南
本文详细介绍HanLP的安装步骤及注意事项,涵盖1.x版本的Java实现与2.x版本的Python实现,包括必要文件的获取与配置,以及对tensorflow版本的要求。
部署运行你感兴趣的模型镜像

hanlp安装提示

Hanlp项目介绍直接见Github开源介绍:.

HanLP项目主页:https://github.com/hankcs/HanLP

HanLP下载地址:https://github.com/hankcs/HanLP/releases

  对github不是很熟的老铁们,可能还是不想看github上链接无数的说明。
于是还是简单说明一下:
  作者写的hanlp 1.x版本用的是java写的,用的时候直接调用java包就可以使用了。python用jpype调用java包。
不过值得注意的是工程下必须要有hanlp.properties、hanlp-1.7.7.jar、data文件夹,data文件夹来自 https://file.hankcs.com/hanlp/data-for-1.7.5.zip解压的data文件夹。
  hanlp.properties、hanlp-1.7.7.jar在同一个压缩包类,见HanLP下载地址。将三者放在同一路径

  目前hanlp已经到2.xx版本了。这个版本开始是用python写的,里面用到tensorflow2.xx版本,必须要有nvidia的驱动才能不出错,tensorlfow1版本会出错,建议舍弃tensorflow1版本,用2版本。
  另外 pip install hanlp就是2.x版本的。

  版本问题改变确实增加了使用的复杂度,带来很多问题,因此,有实力的还是用原生代码编写,不用他人的模块。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-两字组(速度与精度最佳平衡;一百兆内存) 最短路分词,N-最短路分词 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 感知机分词,CRF分词 词典分词(侧重速度,每秒数千万字符;省内存) 极速词典分词 所有分词器都支持: 索引全切分模式 用户自定义词典 兼容繁体中文 训练用户自己的领域模型 词性标注 HMM词性标注(速度快) 感知机词性标注,CRF词性标注(精度高) 命名实体识别 基于HMM角色标注的命名实体识别(速度快) 中国人名识别,音译人名识别,日本人名识别,地名识别,实体机构名识别 基于线性模型的命名实体识别(精度高) 感知机命名实体识别,CRF命名实体识别 关键词提取 TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息左右信息熵的短语提取 拼音转换 多音字,声母,韵母,声调 简繁转换 简繁分歧词(简体,繁体,台湾正体,香港繁体) 文本推荐 语义推荐,拼音推荐,字词推荐 依存句法分析 基于神经网络的高性能依存句法分析器 基于ArcEager转移系统的柱搜索依存句法分析器 文本分类 情感分析 文本聚类 KMeans,Repeated Bisection,自动推断聚类数目k word2vec 词向量训练,加载,词语相似度计算,语义运算,查询,KMEANS聚类 文档语义相似度计算 语料库工具 部分默认模型训练自小型语料库,鼓励用户自行训练。模块所有提供训练接口,语料可参考98年人民日报语料库。 在提供丰富功能的同时,HanLP内部模块坚持低耦合,模型坚持惰性加载,服务坚持静态提供,词典坚持明文发布,使用非常方便。默认模型训练自全世界最大规模的中文语料库,同时自带一些语料处理工具,帮助用户训练自己的模型。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值