es分析器
分析:文档加入倒排索引之前,es在其主体上进行的操作。
1,字符过滤器
2,分词
3,分词过滤器
4,分词索引
搜索也同样会用到过滤器,例如match,match_phrase
Term ,terms搜索之前不会分析
设置分析器方法
1:创建索引的时候指定分析器,可以为单独的字段设置不同的分析器
2:在配置文件中配置分析器
分析器由一个分词器,以及若干在此分词器之前的字符过滤器,在此分词器之后的分词过滤器组成
内置分析器:
1:标准分析器
2:简单分析器
3:空白分析器
4:停用词分析器
5:关键词分析器
6:模式分析器
7:语言多语言分析器
8:雪球分析器
字符过滤器
处理字符:例如将&转化为and
分词器:
1:标准分词器
2:关键词分词器
3:字母分词器
4:小写分词器
5:空白分词器
6:模式分词器
7:UAX URL电子邮件分词器
8:路径层次分词器
分词过滤器:
1:标准分词过滤器
2:小写分词过滤器
3:长度分词过滤器
4:停用词分词过滤器
5:截断分词过滤器,修剪分词过滤器,限制分词数量过滤器
6:颠倒分词过滤器
7:唯一分词过滤器
8:ASCII折叠分词过滤器
9:同义词分词过滤器
N元语法,侧边N元语法,滑动窗口分词过滤器
提取词干过滤器等

本文深入解析了Elasticsearch(ES)分析器的工作原理,包括字符过滤器、分词、分词过滤器及分词索引的过程。介绍了如何设置分析器,并详细列举了ES内置的各种分析器、分词器及过滤器,帮助读者理解全文检索背后的技术细节。

被折叠的 条评论
为什么被折叠?



