solr 3.5安装 及分词器配置

本文介绍如何在Windows环境下安装Solr3.5,并与Tomcat6及Lucene3.5进行集成。此外,还详细描述了如何配置IKAnalyzer3.2.8作为分词器,包括必要的jar包添加、schema.xml文件修改等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、搭建说明

环境:

1.系统:windows7 x86_64

2.java 版本 :jdk1.8

3.tomcat 版本:tomcat 6

4.solr:solr3.5.0

5.lucene:lucene 3.5.0

6.中文分词起mmseg4j

二、下载

solr 3.5下载地址:http://www.apache.org/dist//lucene/solr/

三、solr 3.5的安装

1.修改tomcat http服务监听端口

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/>

 修改默认端口8080,可以不修改,添加字符编码  URIEncoding="UTF-8" 否则中文会乱码

    注:如果是你一个系统启动多个tomcat你要同时修改三个端口,以保证每个tomcat都不同,才能同时启动

    1.tomcat http端口

    2.tomcat shutdown 端口

2.在apache-solr-3.5.0\dist目录下找到apache-solr-3.5.0.war把重命名为solr.war 并上传到 tomcat-6/webapps下。

3.创建一个solr.xml文件,在tomcat-7.0.14\conf\Catalina\localhost\下创建一个solr.xml文件。内容为:      

<?xml version="1.0" encoding="UTF-8"?>

<Context docBase="F:\apache-tomcat-6.0.37\webapps\solr"   debug="0" crossContext="true">

    <Environment name="solr/home" type="java.lang.String"  value="F:\apache-tomcat-6.0.37\solr" override="true" />

</Context>

注:docBase 指向应用所在目录,主要用来为应用设置环境变量

4.把apache-solr-3.5.0\example目录下的solr文件夹上传到e:/tomcat-6目录下(即tomcat根目录下,同bin在一个目录下).索引文件会默认会放到 e:/tomcat-6\solr\data下.

5.重新tomcat 在浏览器中输入:http://localhost:8080/  会出现:

        welcome to solr  

        solr admin  说明发布已成功!

 

 

 

四、分词器配置

   1.整合 汉字分词器 IKAnalyzer 3.2.8

        1).添加IKAnalyzer3.2.8.jar

           把IKAnalyzer3.2.8.jar放到 tomcat-7.0.14\webapps\solr\WEB-INF\lib下;

        2).schema.xml 增加信息

            进入目录编辑schema.xml文件,在<Types>下添加以下内容: 

            

<fieldType name="text" class="solr.TextField" >  

               <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  

               <analyzer type="index">  

                   <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>  

                   <filter class="solr.StopFilterFactory"  

                           ignoreCase="true" words="stopwords.txt"/>  

                   <filter class="solr.WordDelimiterFilterFactory"  

                           generateWordParts="1"  

                           generateNumberParts="1"  

                           catenateWords="1"  

                           catenateNumbers="1"  

                           catenateAll="0"  

                           splitOnCaseChange="1"/>  

                   <filter class="solr.LowerCaseFilterFactory"/>  

                   <filter class="solr.EnglishPorterFilterFactory"  

                       protected="protwords.txt"/>  

                   <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>  

               </analyzer>  

                 <analyzer type="query">  

                   <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>  

                   <filter class="solr.StopFilterFactory"  

                           ignoreCase="true" words="stopwords.txt"/>  

                   <filter class="solr.WordDelimiterFilterFactory"  

                           generateWordParts="1"  

                           generateNumberParts="1"  

                           catenateWords="1"  

                           catenateNumbers="1"  

                           catenateAll="0"  

                           splitOnCaseChange="1"/>  

                   <filter class="solr.LowerCaseFilterFactory"/>  

                   <filter class="solr.EnglishPorterFilterFactory"  

                       protected="protwords.txt"/>  

                   <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>  

               </analyzer>  

    </fieldType>

 

然后在<fields>下添加:

 

<field name="name1" type="text" indexed="true" stored="true" required="true" />

        3)、重起tomcat 在浏览器中输入:http://localhost:8080/solr/admin/analysis.jsp进去 solr admin 显示:

 

转载于:https://my.oschina.net/u/218567/blog/1615229

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值