在Solr中配置中文分词IKAnalyzer

最新推荐文章于 2019-05-24 13:54:00 发布

weixin_33862993

最新推荐文章于 2019-05-24 13:54:00 发布

阅读量135

点赞数

文章标签： java

本文详细介绍了如何在Solr中配置IKAnalyzer进行中文分词，包括配置文件schema.xml的设置、相关jar包的放置以及测试IKAnalyzer分词效果的方法。通过配置可以扩展个人词典和自定义停顿词。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、在配置文件schema.xml（位置{SOLR_HOME}/config/下），配置信息如下：

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index">
            <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
        <analyzer type="query">
            <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
                <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
    </fieldType>

2、在IKAnalyzer相关的jar包（IKAnalyzer2012_u6.jar 本博客不提供下载）放在{SOLR_HOME}/lib下。

3、测试IKAnalyzer中文分词效果：