LingPipe使用笔记

LingPipe是一个强大的Java自然语言处理工具包,涵盖了主题分类、命名实体识别、词性标注等多个功能。在Windows环境下,需要安装Eclipse、JDK1.7和Ant来使用。本文提供了LingPipe的下载链接以及拼写检查和语种识别的使用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of SpeechTagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(CharacterLanguage Modeling)、医学文献下载/解析/索引(MEDLINE Download, Parsing and Indexing)、数据库文本挖掘(DatabaseText Mining)、中文分词(Chinese Word Segmentation)、情感分析(SentimentAnalysis)、语言辨别(Language Identification)等API(来源:oschina)。

 

使用实例:

首先到http://alias-i.com/lingpipe/web/download.html下载免费版。我是在windows764位下做的测试,你的电脑需要安装3个软件:eclipse,jdk1.7,ant.

Eclipse下载地址:http://www.eclipse.org/downloads/

Jdk1.7下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html

Ant下载地址:http://ant.apache.org/

Eclipse是一个集成开发工具,jdk1.7是java编译器,ant类似c/c++中的make很强大,我也是菜鸟,ant入门教程:

http://www.java3z.com/cwbwebhome/article/article2/2764.html?id=1271

下面你们可以参考:

LingPipe拼写检查http://blog.youkuaiyun.com/fancyerii/article/details/6314130

 

语种识别(window下):

f:

cd F:\software\应用API\语种识别\lingpipe-4.1.0

cd demos/tutorial/langid

java -cplanguageId.jar;../../../lingpipe-4.1.0.jar RunLanguageId../../models/langid-leipzig.classifier "hello"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值