【Elasticsearch】内置分析器概述

内置分析器参考

Elasticsearch 随附了广泛类型的内置分析器,可以在任何索引中使用,无需进一步配置:

 

标准分析器

`standard`分析器根据 Unicode 文本分段算法定义的单词边界将文本划分为词条,会移除大部分标点符号,将词条转为小写,并支持移除停用词。

 

简单分析器

`simple`分析器在遇到非字母字符时将文本划分为词条,会将所有词条转为小写。

 

空白分析器

`whitespace`分析器在遇到任何空白字符时将文本划分为词条,不会将词条转为小写。

 

停用词分析器

`stop`分析器类似于`simple`分析器,但还支持移除停用词。

 

关键字分析器

`keyword`分析器是一个“无操作”分析器,它接受给定的任何文本,并将完全相同的文本作为单个词条输出。

 

模式分析器

`pattern`分析器使用正则表达式将文本划分为词条,支持小写化和停用词。

 

语言分析器

Elasticsearch 提供了许多语言特定的分析器,例如`english`或`french`。

 

指纹分析器

`fingerprint`分析器是一种专业分析器,它创建一个可用于重复检测的指纹。

 

如果你没有找到适合你需求的分析器,你可以创建一个`custom`自定义分析器,它将结合适当的字符过滤器、分词器和令牌过滤器。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值