配置好了solr环境 (查看 solr环境搭建), 就可以加入solr中文分词,其步骤如下:
1) 下载IK中文分词
http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip
2)将解压后的stopword.dic,IKAnalyzer.cfg.xml,IKAnalyzer2012FF_u1.jar加入tomcat webapp中相关solr实例的lib文件夹下(WEB-INF中的lib)。
3)修改 ${catalina_home}\solr_config\solr\collection1\conf\schema.xml文件,在<types></types>标签中添加分词器.
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
4)添加完成后,要设定一个字段运用这个分词器,就暂定为name字段吧,还是在这个xml中的顶上处修改一下,将以前的text_general改成text_ik。
<!-- <field name="name" type="text_general" indexed="true" stored="true"/>--> <field name="name" type="text_ik" indexed="true" stored="true"/>
5)重启tomcat,打开solr,选择collection1,并点击Analysis,在右边的页面上如下图设置,可看到相关的分词信息。

本文详细介绍了如何在Solr环境下配置并使用IK中文分词进行全文检索,包括下载IK分词包、整合到Tomcat Web应用、修改配置文件、设定分词字段及重启服务等关键步骤。
137

被折叠的 条评论
为什么被折叠?



