解决IkAnalyzer分词后文章字符全角变半角,字母大写变小写问题
工作中利用ik对 文章里的字符做分词 然后返回分词后的字符 进行关键字替换最后处理后的字符 发下文章里的全角都被ik改成了半角,英文字母如果是大写的也被ik改成了小写 ,这是ik分词内部类规则的一个特性一般用来做搜索的时候用的,这个没错,但是在我的需求里用不到这个特性所以我必须把它去掉打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里有个...
2014-07-18 16:34:25 ·
366 阅读 ·
1 评论