中文分词器

本文介绍如何使用ES IK插件优化Elasticsearch的中文分词效果,包括插件安装步骤及自定义热词的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

中文分词器

使用因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉子。因此引入中文分词器-es-ik插件

在下载使用插件时候 一定要注意 版本对应!

github地址: https://github.com/medcl/elasticsearch-analysis-ik/releases/

 

这个插件里面用到HttpClient 因为要远程获取关键词 拉取网上的热词  还有es通信

 

安装:

第一步:下载es的IK插件(资料中有)命名改为ik插件

第二步: 上传到/home/elasticsearch-6.4.3/plugins

第三步:      unzip ik.zip        

第四步: 重启elasticsearch即可

 

使用:分词结果  发送get请求

 

 自定义热词,扩展词:

/elasticsearch-6.4.3/plugins/ik/config目录下

 

vi custom/new_word.dic  (在ik的目录中的config下(/home/elasticsearch/elasticsearch-6.4.3/plugins/ik/config)创建一个目录 下入下面的内容)

老铁

王者荣耀

洪荒之力

共有产权房

一带一路

 

 

 修改到指定目录:

 

 

 然后启动ES:

成功!

看看:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值