一.安装IKAnalyzer中文分词器
-
先下载solr7版本的ik分词器,下载地址:IKAnalyzer下载
-
使用Xftp将IKAnalyzer的
ik-analyzer-solr7-7.x.jar
包上传到/usr/local/solr/tomcat8/webapps/solr7/WEB-INF/lib
目录下:
-
将
IKAnalyzer.cfg.xml
扩展配置文件和stopword.dic
文件上传到/usr/local/solr/tomcat8/webapps/solr7/WEB-INF/classes
目录下:
-
打开solrcore下的conf目录,在schema.xml中配置指定中文分词器:
vim managed-schema
并添加如下代码:
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
这里fieldType 的name可以自己取,也可以写默认的text_ik写法,在solr页面中选择分词器时候,选择自己取得name名即可调用IKAnalyzer分词器。
- 重启tomcat并登录solr页面:
效果展示:
二.实现扩展词典功能
- 进入IKAnalyzer拓展配置文件所在目录:
cd /usr/local/solr/tomcat8/webapps/solr7/WEB-INF/classes
打开IKAnalyzer.cfg.xml配置文件:vim IKAnalyzer.cfg.xml
发现如下配置,其中ext.dic文件用来存放扩展词,stopword.dic用来存放停词。
- 我们打开扩展词文件进行添加扩展词并保存:
vim ext.dic
3.重启tomcat,再进行分词功能查看: