Elasticsearch替换中文分词

本文介绍了如何使用ik分词器替换Elasticsearch的默认中文分词器。首先从github下载项目,然后通过unzip解压,接着使用maven编译成jar包。最后将jar包复制到Elasticsearch的plugins/ik目录,并根据需求选择ik_max_word或ik_smart进行配置。重启Elasticsearch即可完成替换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Elasticsearch的中文分词很烂,所以用ik替换。首先从github上下载项目,地址是:https://github.com/medcl/elasticsearch-analysis-ik

(1)使用unzip解压

unzip elasticsearch-analysis-ik-master.zip

如果提示找不到unzip,使用yum安装就行了。

(2)编译jar包

使用maven打包,如果没安装的话用yum安装

yum install maven

打包的命令:

cd elasticsearch-analysis-ik-master
mvn package

等待打包过程,期间还要从网上下载依赖,waiting…

(3)配置

copy and unzip target/releases/elasticsearch-analysis-ik-{version}.zip to your-es-root/plugins/ik

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;

ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

重启service elasticsearch restart,搞定。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值