版本
ES
5.4.2
自带的几种分词器
| 分词器 | 解释 |
|---|---|
| standard | 标准标记器,标准过滤器,小写过滤器,停止过滤器 |
| simple | 小写的分词器 |
| stop | 小写标记器,停止过滤器 |
| keyword | 不分词,内容整体作为一个值 |
| whitespace | 以空格分词 |
| language | 以语言分词 |
| snowball | 标准标记器,标准过滤器,小写过滤器,停止过滤器,雪球过滤器 |
| custom | 自定义分词。至少需要指定一个 Tokenizer, 零个或多个Token Filter, 零个或多个Char Filter |
| pattern | 正则分词 |
准备
- 删除之前的索引,否则会报已存在错误
正文
- fielddata是为了能使用aggs,不需要的可以不加
PUT index名
{
"mappings":{
"doc":{
"properties":{
"字段名": {
"type": "指定字段类型,如text",
"analyzer": "指定分词器,如whitespace",
"fielddata": true
},
"其他字段名": {
"type": "keyword"
}
}
}
}
}
5219

被折叠的 条评论
为什么被折叠?



