【Elasticsearch教程12】Mapping字段类型之object

本文介绍了Elasticsearch中object类型的使用方法,包括创建mapping、插入数据和查询数据等步骤,并对比了传统数据库的存储方式。同时,文章还强调了在存储多个JSON对象时应选择nested类型而非object类型。


首先给出结论:

  • 在一个字段存储一个JSON对象,可以选择object类型
  • 在一个字段存储多个JSON对象,可以选择nested类型

一、传统数据库存object

假设有一个人员信息如下:

{ 
  "region": "US",
  "manager": { 
    "age":     30,
    "name": { 
      "first": "John",
      "last":  "Smith"
    }
  }
}

建表时会建一个字段存一个值,它的缺点是字段扁平化, 无法直观的表现层级关系

字段
regionUS
manager_age30
manager_firstnameJohn
manager_lastnameSmith

二、ES存object

ES中,一个字段存的就是一个JSON,JSON格式本身就包含嵌套的层级关系。

2.1 创建mapping

  • 一层有2个字段:regionmanager
  • manager包含2个字段: agename
  • name包含2个字段:firstlast
PUT pigg_test_object
{
  "mappings": {
    "properties": {
      "region": {
        "type": "keyword"
      },
      "manager": {
        "properties": {
          "age": {
            "type": "integer"
          },
          "name": {
            "properties": {
              "first": {
                "type": "keyword"
              },
              "last": {
                "type": "keyword"
              }
            }
          }
        }
      }
    }
  }
}

2.2 插入数据

PUT pigg_test_object/_doc/1
{ 
  "region": "US",
  "manager": { 
    "age":     30,
    "name": { 
      "first": "John",
      "last":  "Smith"
    }
  }
}

在ES内部,这些值其实是按如下格式存储的

{
  "region":             "US",
  "manager.age":        30,
  "manager.name.first": "John",
  "manager.name.last":  "Smith"
}

2.3 查询object数据

查询子字段时,得输入字段的全名,如manager.name.first

GET /pigg_test_object/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "manager.name.first": {
              "value": "John"
            }
          }
        }
      ]
    }
  }
}

三、object不要存数组

3.1 存入object数组

  • 30岁的John Smith
  • 40岁的Geen Hank
PUT pigg_test_object/_doc/1
{
    "region":"US",
    "manager":[
        {
            "age":30,
            "name":{
                "first":"John",
                "last":"Smith"
            }
        },
        {
            "age":40,
            "name":{
                "first":"Geen",
                "last":"Hank"
            }
        }
    ]
}

3.2 验证错误的查询结果

查询30岁的Geen按照正常理解,是不应该查询出来结果的,但是它能返回数据

GET /pigg_test_object/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "manager.age": {
              "value": "30"
            }
          }
        },
        {
          "term": {
            "manager.name.first": {
              "value": "Geen"
            }
          }
        }
      ]
    }
  }
}

这是因为在ES内部,数据会如下格式存储

{
  "region":             "US",
  "manager.age":        [30, 40],
  "manager.name.first": ["John", "Geen"],
  "manager.name.last":  ["Smith", "Hank"]
}

这样的存储方式没有把2个人信息分开存储,而是混合在一起,所以有了文章开头的结论:

  • 在一个字段存储一个JSON对象,可以选择object类型
  • 在一个字段存储多个JSON对象,可以选择nested类型

四、object的参数enabled

  • enabled参数只用于object类型,默认值是true(开启)
  • 为true时,ES会object里的所有字段进行索引操作, 这样就可以根据该字段检索文档
  • 为false时,ES不去解析object里的字段,不会索引每个字段
  • 当只需要返回该字段用于展示,而不需要索引某个字段时(例如session信息,我们很少用session作为查询条件),可设置enabled=false

实验如下:

PUT pigg_test_enabled
{
  "mappings": {
    "properties": {
      "name": {"enabled": false}
    }
  }
}

插入多种格式的值

PUT pigg_test_enabled/_doc/1
{
  "name": "winter"
}

PUT pigg_test_enabled/_doc/2
{
  "name": {
    "first_name": "wang",
    "last_name": "dong"
  }
}

GET pigg_test_enabled/_search

返回发现: 不同的值都可以存入
 "hits" : [
      {
        "_index" : "pigg_test_enabled",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "name" : "winter"
        }
      },
      {
        "_index" : "pigg_test_enabled",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
          "name" : {
            "first_name" : "wang",
            "last_name" : "dong"
          }
        }
      }
    ]

查看mapping

GET pigg_test_enabled/_mapping

返回如下: name类型是object, 并不会解析name在其下面添加first_name和last_name子字段
{
  "pigg_test_enabled" : {
    "mappings" : {
      "properties" : {
        "name" : {
          "type" : "object",
          "enabled" : false
        }
      }
    }
  }
}

在enable=false的字段上检索文档, 是查询不到数据的

GET pigg_test_enabled/_search
{
  "query": {
    "term": {
      "name": {
        "value": "winter"
      }
    }
  }
}

返回没有数据

下一篇博客会详细讲解nested类型,如果本文对您有帮助,就给亚瑟王点个赞👍吧。

### Elasticsearch 中的 Mapping 字段类型Elasticsearch中,字段的数据类型定义了如何存储和查询该字段的内容。每种数据类型的处理方式不同,因此选择合适的数据类型对于优化性能至关重要[^1]。 #### 基础数据类型 - **文本 (Text)**:适用于全文检索的字符串内容。通常会经过分词器处理以便于搜索操作。 - **关键字 (Keyword)**:用于精确匹配、聚合或者排序的字符串。不会被分割成多个词条而是作为一个整体对待。 - **数值型 (Numeric Types)**:包括`long`, `integer`, `short`, `byte`, `double`, 和 `float`. 这些用来表示整数或浮点数,并支持范围查询等功能。 - **布尔值(Boolean)**:简单的真/假标志位。 - **日期(Date)**:时间戳或其他形式的时间表达式,能够解析多种格式并执行日期运算。 - **二进制(Binary)**:原始字节序列,常用于保存文件哈希等不可读取的信息。 #### 复杂数据结构 - **对象(Object Type)**:允许嵌套其他简单或复杂属性的对象。内部子字段可以直接访问而无需扁平化整个文档。 - **数组(Array)**:任何基本类型都可以作为列表成员存在;即使是混合不同类型也是可行的,不过不建议这样做因为可能导致意外行为。 - **地理空间(Geo Point & Geo Shape)**:专门针对地理位置设计的支持坐标系转换以及距离计算的功能特性。 为了满足特定需求场景下的灵活性,还可以在同一物理字段上创建多重映射视图: ```json PUT my-index-000001 { "mappings": { "properties": { "city": { "type": "text", "fields": { "raw": { "type": "keyword" } } } } } } ``` 上述配置使得`city`既可用于自由文本查找又能在必要时充当分类标签参与统计分析[^2]。 值得注意的是,在较新的版本里,“_type”已被弃用,这意味着不再通过它来进行多态区分,转而在单个索引下统一管理所有记录实例[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

瑟王

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值