}
1.2 定制日期类型检测格式
可以通过类型级别(_type)级别通过dynamic_date_formats参数来自定义日期检测格式,示例如下:
PUT my_index
{
“mappings”: {
“_doc”: {
“dynamic_date_formats”: [“MM/dd/yyyy”]
}
}
}
PUT my_index/_doc/1
{
“create_date”: “09/25/2015”
}
1.3 numeric detection
数字类型检测。同样如果数字类型的值在JSON中是用字符串表示的话,如果开启日期类型检测,同样在创建映射时会映射为数字类型,而不是字符串类型。
PUT my_index
{
“mappings”: {
“_doc”: {
“numeric_detection”: true
}
}
}
默认情况下,numeric_detection为false。
2、Dynamic templates
Dynamic field mappings默认情况下是根据elasticsearch支持的数据类型来推测参数值的类型,而动态模板允许您定义自定义映射规则,根据自定义的规则来推测字段值所属的类型,从而添加字段类型映射。
动态映射模板通过如下方式进行定义:
“dynamic_templates”: [ // @1
{
“my_template_name”: { // @2
… match conditions … // @3
“mapping”: { … } // @4
}
},
…
]
代码@1:在类型映射时通过dynamic_templates属性定义动态映射模板,其类型为数组。
代码@2:定义动态映射模板名称。
代码@3:匹配条件,其定义方式包括:match_mapping_type, match, match_pattern, unmatch, path_match, path_unmatch。
代码@4:匹配@3的字段使用的类型映射定义(映射参数为类型映射中支持的参数)
动态类型映射模板的核心关键是匹配条件与类型映射,接下来按照匹配条件定义方式来重点讲解动态类型模板映射机制。
2.1、match_mapping_type
首先使用json解析器解析字段值的类型,由于JSON不能区分long和integer,也不允许区分double和float,所以它总是选择更广泛的数据类型, 例如5,在使用字段动态映射时,elasticsearch会将字段动态映射为long而不是integer类型,那如何将数字5动态映射为integer类型呢,利用match_mapping_type可以实现上述需求,例如,如果希望将所有整数字段映射为整数而不是long,并将所有字符串字段映射为文本和关键字,可以使用以下模板:
PUT my_index
{
“mappings”: {
“_doc”: {
“dynamic_templates”: [
{
“integers”: {
“match_mapping_type”: “long”,
“mapping”: {
“type”: “integer”
}
}
},
{
“strings”: {
“match_mapping_type”: “string”,
“mapping”: {
“type”: “text”,
“fields”: {
“raw”: {
“type”: “keyword”,
“ignore_above”: 256
}
}
}
}
}
]
}
}
}
一言以蔽之,match_mapping_type为字段动态映射(字段类型检测)得出的类型建立一个映射关系,将该类型转换为mapping定义中的类型。
2.2、match and unmatch
match参数使用模式匹配字段名,而unmatch使用模式排除匹配匹配的字段。
match、unmatch示例如下:
PUT my_index
{
“mappings”: {
“_doc”: {
“dynamic_templates”: [
{
“longs_as_strings”: {
“match_mapping_type”: “string”, // @1
“match”: “long_*”, // @2
“unmatch”: “*_text”, // @3
“mapping”: { // @4
“type”: “long”
}
}
}
]
}
}
}
PUT my_index/_doc/1
{
“long_num”: “5”, // @5
“long_text”: “foo” // @6
}
代码@1:表示该自动映射模板针对的字段为JSON解析器检测字段的类型为string的新增字段。
代码@2:字段名称以long_开头的字段。
代码@3:排除字段名称以_text的字段。
代码@4:符合long_开头的字段,并且不是以_text结尾的字段,如果JSON检测为string类型的新字段,映射为long。
代码@5:long_num,映射类型为long。
代码@6:long_text虽然也满足long_开头,但是以_text结尾,故该字段不会映射为long,而是保留其JSON检测到的类型string,会映射为text字段和keyword多字段(参考字段动态映射机制)。
2.3、match_pattern
使用正则表达式来匹配字段名称。
“dynamic_templates”: [
{
“longs_as_strings”: {