solr 3.5.0 与 tomcat 7.0.5 整合配置

本文介绍如何部署Solr搜索平台,并详细说明如何配置中文分词功能,包括环境变量设置、war包部署及schema.xml文件修改等步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.将D:\software\lucene-3.6.0\apache-solr-3.5.0\example\solr下的文件拷贝到要作为服务器的位置(如:D:\lucene\solr\home),可以删除data目录下的数据,保留data文件夹;
2.将D:\software\lucene-3.6.0\apache-solr-3.5.0\example\webapps中的solr.war程序也拷贝出来(D:\lucene\solr\server);,并解压solr.war

3.打开D:\lucene\solr\home文件夹中的conf (D:\lucene\solr\home\config)下的solrconfig.xml, 配置<dataDir>${solr.data.dir:}</dataDir>为(这里指定data的路径)

<dataDir>${solr.data.dir:D:\lucene\solr\home\data}</dataDir>

  

4.设置相应的tomcat中的server.xml的context,在<Host appBase="webapps" autoDeploy="true" name="localhost" unpackWARs="true" xmlNamespaceAware="false" xmlValidation="false">下面增加类似如下内容:

<Context path="/solr" docBase="D:\lucene\solr\server\solr" reloadable="false"></Context>  

  

5.为context设置相应的环境变量,说明solr的主目录的地址(在coontext中增加environment):

<Context path="/solr" docBase="D:\lucene\solr\server\solr" reloadable="false">  
<Environment name="solr/home" type="java.lang.String" value="D:\lucene\solr\home" override="true"/>  
</Context>

  

6.修改solrconfig中的

<queryResponseWriter name="velocity" class="solr.VelocityResponseWriter" enable="${solr.velocity.enabled:false}"/>

  

7: 修改D:\lucene\solr\server\WEB-INF\web.xml 打开

<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/lucene/solr/home</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

  

8: 启动tomcat   

 

9:通过localhost:8080/solr验证配置,出现如下页面说明配置成功

 

10:加入中文分词(这里需要下载中文分词包,我下载的是mmseg4j)

将中文分词的包加入到Server的lib中;

 在 solr的 schema.xml 中定义 field type如:

<fieldType name="textComplex" class="solr.TextField" >  
      <analyzer>  
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>  
      </analyzer>  
    </fieldType>  
<fieldType name="textMaxWord" class="solr.TextField" >  
      <analyzer>  
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>  
      </analyzer>  
    </fieldType>  
<fieldType name="textSimple" class="solr.TextField" >  
      <analyzer>  
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/OpenSource/apache-solr-1.3.0/example/solr/my_dic"/>  
      </analyzer>  
    </fieldType>

  dicPath 指定词库位置(每个MMSegTokenizerFactory可以指定不同的目录,当是相对目录时,是相对 solr.home 的目录),mode 指定分词模式(simple|complex|max-word,默认是max-word)。

把mmseg4j的data中的四个文件(chars.dic;units.dic; words.dic; words-my.dic)拷贝到dic中.

OK,这样就配置成功了,而且还可以使用mmseg4j中文分词。

转载于:https://www.cnblogs.com/Jansens520/p/7838012.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值