elasticsearch默认提供了standard分词器,但对中文的分词效果不尽人意:

可以看出,把词语分成了一个个的汉字,这并不是我们想要的,接下来介绍下中文分词器-IK分词器的安装及使用。
1、IK分词器下载及安装
github: https://github.com/medcl/elasticsearch-analysis-ik
各版本分词器下载: https://github.com/medcl/elasticsearch-analysis-ik/releases
选择版本与elasticsearch一致的版本:7.9.2

下载后解压,将解压后的文件夹elasticsearch-analysis-ik-7.9.2 拷贝至 elasticsearch的plugins文件下:

Elasticsearch默认的standard分词器对中文分词效果不佳,本文介绍了中文分词器IK分词器的安装及使用。包括下载与安装步骤,两种分词模式ik_smart和ik_max_word的测试,还说明了扩展词典的方法以及热更新IK分词的使用方式。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



