elasticsearch学习-分析器相关

本文深入解析了Elasticsearch(ES)分析器的工作原理,包括字符过滤器、分词、分词过滤器及分词索引的过程。介绍了如何设置分析器,并详细列举了ES内置的各种分析器、分词器及过滤器,帮助读者理解全文检索背后的技术细节。

es分析器

分析:文档加入倒排索引之前,es在其主体上进行的操作。

1,字符过滤器

2,分词

3,分词过滤器

4,分词索引

搜索也同样会用到过滤器,例如match,match_phrase

Term ,terms搜索之前不会分析

 

设置分析器方法

1:创建索引的时候指定分析器,可以为单独的字段设置不同的分析器

2:在配置文件中配置分析器

分析器由一个分词器,以及若干在此分词器之前的字符过滤器,在此分词器之后的分词过滤器组成

 

内置分析器:

1:标准分析器

2:简单分析器

3:空白分析器

4:停用词分析器

5:关键词分析器

6:模式分析器

7:语言多语言分析器

8:雪球分析器

 

字符过滤器

处理字符:例如将&转化为and

 

分词器:

1:标准分词器

2:关键词分词器

3:字母分词器

4:小写分词器

5:空白分词器

6:模式分词器

7:UAX URL电子邮件分词器

8:路径层次分词器

 

分词过滤器:

1:标准分词过滤器

2:小写分词过滤器

3:长度分词过滤器

4:停用词分词过滤器

5:截断分词过滤器,修剪分词过滤器,限制分词数量过滤器

6:颠倒分词过滤器

7:唯一分词过滤器

8:ASCII折叠分词过滤器

9:同义词分词过滤器

N元语法,侧边N元语法,滑动窗口分词过滤器

提取词干过滤器等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值