Java汉语言处理工具:HanLP初体验

这篇博客介绍了作者在Java项目中使用HanLP作为自然语言处理工具的初体验,包括HanLP的特点、安装过程以及遇到的问题和解决方法。经过初次测试,作者确认HanLP已成功安装并可用于文本处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近需要用分词系统对新闻文本做一些处理,之前用了jieba做的,但jiaba识别人名、地名、各种名字的表现很差,所以要么自己写识别算法,要么换分词工具。HanLP看了下介绍,感觉挺不错的,功能能扣得上我的需求。言归正传,往下走。

HanLP

HanLP是清华大学开发的,由一系列模型与算法组成的开源Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。

在提供丰富功能的同时,HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料。(转自官网,有修改)
官网:http://hanlp.linrunsoft.com/index.html

安装

不得不说maven真是个好东西,繁杂的配置工程,只用在pom.xml里加几行这个,就ok了,真的造福我们这种懒人。

<dependency>
    <groupId>com.hankcs</groupId>
    <artifactId>hanlp</artifactId>
    <version>portable-1.2.8</version>
</dependency>

加上以后记得要在maven build里面compile一下

如果不是maven工程,可以跟着官网文档的步骤慢慢来:
http://hanlp.linrunsoft.com/doc.html

初测

compil

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值