apache solr配置

最新推荐文章于 2024-07-31 15:45:53 发布

贾小仙

最新推荐文章于 2024-07-31 15:45:53 发布

阅读量149

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/jiazhipeng12/article/details/90118168

本文介绍如何在Windows 7 64位环境下安装Solr 4.10.4，并集成IKAnalyzer中文分词器。包括将Solr部署到Tomcat的具体步骤，配置solrconfig.xml和schema.xml文件，以及添加IKAnalyzer的jar包和配置文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

硬件环境

window版本为：windows 7 64位

软件环境

JDK版本：1.6.0_13

solr版本：4.10.4

tomcat版本：tomcat 6

安装过程

步骤一：复制%solr%\dist\solr-4.10.3.war到tomcat安装目录下的webapp目录，并修改其名称为：solr.war

启动tomcat 目的解压出solr 目录

步骤二：将下载好的solr-4.10.4.zip解压，新建solr_home，解压后拷贝%solrhome%\example\solr该目录下所有文件到D:\tomcat\webapps\solr\solr_home

步骤三：修改D:\tomcat\webapps\solr\solr_home\collection1\conf目录下solrconfig.xml文件，将dataDir节点的值指向步骤一所配置的文件路径。如下图所示：

$FR[HC28RG]{_4L05FR{24}L.png$

步骤四：修改%tomcat%\webapp\solr\WEB-INF\web.xml文件，如下所示：

步骤五：拷贝%solr%\dist\solrj-lib 目录下所有jar包到%tomcat%\lib目录下

步骤六：拷贝%solr%\example\lib\ext 目录下所有jar包和数据库jar包到%tomcat%\webapp\solr\WEB-INFlib目录下。

步骤七：在D:\tomcat\webapps\solr\solr_home\collection1\conf 下新建data-config.xml文件

步骤八：将下载的solr-4.10.4文件夹下的dist, contrib文件夹复制到TomCat根目录下：

步骤九：然后再次修改刚才编辑过的solrconfig.xml增加两个文件夹的配置并修改一些参数：

大约在75行默认有8个路径，但是路径不一定全对，顺着这个配置的路径去找文件夹，根据查找的层数修改这个路径配置，另增加一个新的配置，全文如下：

$CAZD2YE_0GR8T{1V`2@L5CU.png$

这个配置是根据本机推导出来的，大家根据自己的实际情况去修改。

步骤十： 将dist文件夹下的

复制到webapps\solr\WEB-INF\lib下。

步骤十一：配置schema信息（约120多行处）：D:\tomcat\webapps\solr\solr_home\collection1\conf\schema.xml

配置id name 和 innername

还有约270多行处

配置id name 和 innername

最后启动tomcat，在浏览器中输入http://localhost:8080/solr 即可访问solr管理页面，如下图：

值得注意的是，在使用solr的过程中，为了避免因为中文乱码导致搜索不到结果，需要修改tomcat的config/server.xml中Connector的配置：

集成ikanalyzer中文分词器

1、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下载IK Analyzer 2012FF_hf1解压后得到如下目录结构：

2、将IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。

在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下创建classes目录

将IKAnalyzer.cfg.xml、stopword.dic copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes

新建expert.dic添加你程序中的分词，并且以UTF-8无BOM格式编码。

3、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml

在第一个节点内添加如下配置：
<fieldType name="text_ik" class="solr.TextField"><analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/><analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>
将对应需要用ik分词的字段的type改为以上定义的name值 text_ik（大约120行处）：
   <field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/>
   <field name="name" type="text_ik" indexed="true" stored="true"/>
   <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>
配置完成，重启tomcat并访问http://localhost:8080/solr。发现左边可以选择分词器

根据我们配置的中文分词器，选择Manu：

分析一个熊孩子造的句子：小明吃完水果然后喝水

发现非常智能的构建出关键词了。