文章目录
text文本类型或keyword关键字类型
ES2.*版本里面是没有这两个字段,只有string字段。ES5.*及以后的版本,把string字段设置为了过时字段,引入text,keyword字段。
一切文本类型的字符串可以定义成 text文本类型或keyword关键字类型两种类型。区别在于:
-
text类型(文本类型)会使用默认分词器分词,也就是存入的数据会先进行分词,然后将分完词的词组存入索引,当然你也可以为他指定特定的分词器。text类型检索不是直接给出是否匹配,而是检索出相似度,并按照相似度由高到低返回结果。这样会导致本来我们认为应该查询出来的数据有可能会查询不到。
-
keyword类型(关键字类型),那么默认就不会对其进行分词,原样存储。当一个字段需要按照精确值进行过滤、排序、聚合等操作时, 就应该使用keyword类型。keyword类型检索,直接被存储为了二进制,检索时我们直接匹配,不匹配就返回false。所以精确匹配可以用keyword。
那为什么我们有时候使用查询条件时,查询条件里加keyword和不加keyword得到结果有时候和预想当中的不一样呢?
我们来看看,ES默认对字符串类型数据的mapping既有text也有keyword类型,比如:
PUT /test/_doc/1
{
"name":"张三",
"address":"广东深圳",
"age":12
}
PUT /test/_doc/2
{
"name":"李四",
"address":"广西南宁",
"age":13
}
查看该索引的mapping,GET /test/_mapping:
{
"