solr安装IKAnalyzer中文分词器以及实现扩展词典功能

一.安装IKAnalyzer中文分词器

  1. 先下载solr7版本的ik分词器,下载地址:IKAnalyzer下载

  2. 使用Xftp将IKAnalyzer的ik-analyzer-solr7-7.x.jar包上传到/usr/local/solr/tomcat8/webapps/solr7/WEB-INF/lib目录下:
    在这里插入图片描述

  3. IKAnalyzer.cfg.xml扩展配置文件和stopword.dic文件上传到/usr/local/solr/tomcat8/webapps/solr7/WEB-INF/classes目录下:
    在这里插入图片描述

  4. 打开solrcore下的conf目录,在schema.xml中配置指定中文分词器:
    在这里插入图片描述
    vim managed-schema并添加如下代码:

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
      <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

这里fieldType 的name可以自己取,也可以写默认的text_ik写法,在solr页面中选择分词器时候,选择自己取得name名即可调用IKAnalyzer分词器。

  1. 重启tomcat并登录solr页面:

在这里插入图片描述
效果展示:
在这里插入图片描述

二.实现扩展词典功能

  1. 进入IKAnalyzer拓展配置文件所在目录:cd /usr/local/solr/tomcat8/webapps/solr7/WEB-INF/classes
    2.
    打开IKAnalyzer.cfg.xml配置文件:vim IKAnalyzer.cfg.xml
    发现如下配置,其中ext.dic文件用来存放扩展词,stopword.dic用来存放停词。

这里是引用

  1. 我们打开扩展词文件进行添加扩展词并保存:vim ext.dic

在这里插入图片描述
3.重启tomcat,再进行分词功能查看:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值