
ansj
请持续率性
梦想是要有的,万一实现了呢
展开
-
编译Ansj之Solr插件
Ansj是一个比较优秀的中文分词组件,具体情况就不在本文介绍了。ansj作者在其官方代码中,提供了对lucene接口的支持。如果用在Solr下,还需要简单的扩展一下。 1、基于maven管理 ansj是基于maven进行开发管理的。我们首先修改一下其pom.xml,具体如下所示:<project xmlns="http://maven.apache.org/POM/4.0.0"转载 2016-11-28 15:23:21 · 670 阅读 · 0 评论 -
ansj 分词系统的词性说明
汉语文本词性标注标记集 # 1. 名词 (1个一类,7个二类,5个三类) 名词分为以下子类: n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名 nrf 音译人名 ns 地名 nsf 音译地名 nt转载 2017-01-04 09:36:10 · 4703 阅读 · 0 评论 -
在Solr中配置和使用ansj分词
原文:http://www.cnblogs.com/likehua/p/4481219.html 在上一节【编译Ansj之Solr插件】中介绍如何编译ansj分词在solr(lucene)环境中使用的接口,本章将介绍如何在solr中使用ansj,其步骤主要包括:下载或者编译ansj和nlp-lang等jar包、在schema中配置相关类型、将ansj和nlp-lang等jar包配置到solr中、转载 2016-11-28 15:36:47 · 2005 阅读 · 0 评论