如何编译运行HanLP自然语言处理包

本文详细介绍了如何从源代码编译HanLP项目,并在命令行环境下运行其词法分析器模块。针对master和portable两个分支,提供了具体的git clone、mvn install命令及注意事项。强调了资源文件的正确配置方法,以及在Windows和Linux环境下运行的差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


master分支

对于master分支,编译方法如下:

git clone  https://github.com/hankcs/HanLP.git

mvn install -DskipTests

 

·由于目前一些test不够规范,使用了硬编码路径下的资源,所以暂时跳过单元测试。

·该方法不会将src/main/resources目录下的任何资源(包括hanlp.properties)打包进jar,如果需要打包资源文件,请切换到portable分支。

portable分支

git checkout portable

然后将需要的data放入src/main/resources,最后执行:

 

mvn install -DskipTests

运行jar

目前jar包中有一些模块可以命令行执行,以感知机词法分析器为例。由于这些模块一般需要加载外部data,所以需要在运行时指定hanlp.properties。运行时,一个典型的目录结构如下:

87f4f944705fc50f9eef76edf3b8a30e0ca997f6 

·此处只列出了重要的目录。

·一个良好的实践是把hanlp.properties放到resources目录下。

 

命令行需要指定jar包和hanlp.properties所在的目录:

 

$ java -cp target/hanlp-1.6.0.jar:src/main/resources  com.hankcs.hanlp.model.perceptron.Main -test \

<<< '华安集团胡花蕊来到纽约艺术博物馆参观'

[华安/nz 集团/n]/nt 胡花蕊/nr 来到/v [纽约/ns 艺术/n 博物馆/n]/ns 参观/v

 

·Windows用户请使用分号java -cp target/hanlp-1.6.0.jar;src/main/resources

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值