OpenNLP学习笔记1

本文介绍了在Windows环境下学习OpenNLP的过程,包括从官网下载Apache OpenNLP的bin和src包,如何在命令行下进行英文分词测试,以及在Eclipse中编译OpenNLP源码生成jar文件。在解决MANIFEST.MF缺少Main-Class问题后,成功运行批处理文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我是在学习OpenEphyra这个开源对话系统时,遇到了OpenNLP的运行错误,才开始学习OpenNLP的.

学习怎么使用OpenNLP最简单的方法是命令行下调用,以下测试是在win7下进行的.


1. 从官网上下载了apache-opennlp-1.6.0-bin包,从其他网上下载了英语分词的模型文件en-token.bin,放到bin文件夹下.

一个简单的命令行下的英语分词示例如下图(window下执行的是bin文件夹下的批处理文件opennlp.bat, OpenNLP的jar文件是lib\opennlp-tools-1.6.0.jar):



2. 从官网上下载了apache-opennlp-1.6.0-src包,这个是源代码包, 包含以下4个文件夹:


我的目的是使用Eclipse根据opennlp-tools编译出jar文件.在Eclipse创建新的Java Project后, Import "opennlp"的上一层文件夹(此处新手要注意文件夹层次关系,否则编译出错).

编译发现"import org.osgi.framework.BundleActivator"有个错误,但不影响生成jar文件及后续简单的测试.


3. 这样生成opennlp-tools-1.6.0.jar文件后,把该文件拷贝到apache-opennlp-1.6.0-bin\apache-opennlp-1.6.0\lib中替换掉原始的opennlp-tools-1.6.0.jar文件,在命令行下进行1.中的测试,出现了以下的错误:


通过网上搜索[1],发现生成的jar压缩文件中的MANIFEST.MF文件缺失了Main-Class定义,于是增加了以下的定义后,以上的批处理运行正常了.

Main-Class: opennlp.tools.cmdline.CLI


参考:

[1] http://jingyan.baidu.com/article/db55b60990f6084ba30a2fb8.html




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值