elasticsearch添加自定义分词器

本文详细介绍了在Elasticsearch中使用中文分词器的过程,包括安装IK分词器插件、配置自定义词典及重启服务的步骤,解决了中文模糊搜索时分词不准确的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

之前已经成功搭建了elasticsearch

然后去模糊搜索的时候,中文会给拆分出来,因为使用的是非中文分词器。

效果如下,但是,大家都知道红牛都是平时自己喝的饮料,为啥没有涅~。那是因为没有使用中文分词器,那么我们采用中文分词器就需要安装一下插件了。不然是会报错的~

分词器的地址是https://github.com/medcl/elasticsearch-analysis-ik/releases

在这里,切记使用和es相同的版本,我的es是6.6.1,自然我也就使用6.6.1的IK了。

然后下载zip包,解压,上传到es的安装包下的plugins下面,然后重命名为ik,使用非root权限启动即可。

更改一下分词器的类型,即可查询到红牛,那么我来试试我的名字呢?

又给分割成一个个的单词了,该如何是好呢~

这个时候我们就可以使用我们自己自定义的分词器了。

我们在刚才上传的文件里面创建一个文件夹

新建一共new_word.dic文件

里面写一下自定义的分词,例如

然后引入这个分词器

 vim /usr/local/elasticsearch-6.6.1/plugins/ik/config/IKAnalyzer.cfg.xml

<entry key="ext_dict">fenci/new_word.dic</entry>

重启一下,试试,

发现就可以咯。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值