1.之前的项目一直都是用的ik分词器,但是最近的一个项目项目大佬说ik好像很长时间都没更新,版本太老旧,故而用了新的jcseg的分词器,于是也上网找了一些资料,学习了一下如何使用jcseg分词器。
2.http://www.docin.com/p-782941386.html这个是网上找到的Jcseg中文分词器开发说明文档
3.具体实现
在pom文件里面添加相关架包
<dependency>
<groupId>org.lionsoul</groupId>
<artifactId>jcseg-core</artifactId>
<version>1.9.2</version>
</dependency>
jcseg.properties 注意的是那个词典(lexicon)的目录,没有的可以去官网上下载。
# jcseg properties file.
# bug report chenxin <chenxin619315@gmail.com>
# Jcseg function
#maximum match length. (5-7)
jcseg.maxlen=5
#recognized the chinese name.(1 to open and 0 to close it)
jcseg.icnname=1
#maximum chinese word number of english chinese mixed word.
jcseg.mixcnlen=2
#maximum length for pair punctuation text.
jcseg.pptmaxlen=15
#maxim