ElasticSearch5.5.1(核心8)

最新推荐文章于 2025-09-12 20:46:57 发布

weixin_34221112

最新推荐文章于 2025-09-12 20:46:57 发布

阅读量78

点赞数

CC 4.0 BY-SA版权

文章标签：大数据

原文链接：https://my.oschina.net/mdxlcj/blog/1518797

本文介绍了Elasticsearch中部分更新文档及批量查询的方法，并详细解释了文档路由机制及其工作流程，有助于理解如何高效管理和查询数据。

为什么80%的码农都做不了架构师？>>>

1.partial update

post /index/type/id/_update
{
"doc": {
"要修改的少数几个field即可，不需要全量的数据"
}
}

看起来，好像就比较方便了，每次就传递少数几个发生修改的field即可，不需要将全量的document数据发送过去

partial 相比较与全部替换优点：1.所有查询，修改和写回操作，都发生在es中的一个shard中，避免了所有网络数据传输的开销，大大提升了性能。2.减少了修改和查询的时间间隔，可以有效减少并发情况

2. 批量查询

2.1 GET /_mget
{
"docs" : [
{
"_index" : "test_index",
"_type" : "test_type",
"_id" : 1
},
{
"_index" : "test_index",
"_type" : "test_type",
"_id" : 2
}
]
}

2.2 如果查询的document是一个index下的不同type种的话

GET /test_index/_mget
{
"docs" : [
{
"_type" : "test_type",
"_id" : 1
},
{
"_type" : "test_type",
"_id" : 2
}
]
}

2.3

如果查询的数据都在同一个index下的同一个type下，最简单了

GET /test_index/test_type/_mget
{
"ids": [1, 2]
}
重点：

3.document路由

一个index会拥有多个shard，但是创建的document会根据document路由来决定分配到哪个shard，同时也体现了数据都是均匀分配的

路由算法：shard = hash(routing) % number_of_primary_shards

举个例子，一个index有3个primary shard，P0，P1，P2

每次增删改查一个document的时候，都会带过来一个routing number，默认就是这个document的_id（可能是手动指定，也可能是自动生成）
routing = _id，假设_id=1

会将这个routing值，传入一个hash函数中，产出一个routing值的hash值，hash(routing) = 21
然后将hash函数产出的值对这个index的primary shard的数量求余数，21 % 3 = 0
就决定了，这个document就放在P0上。

路由分配过程：
（1）客户端选择一个node发送请求过去，这个node就是coordinating node（协调节点）
（2）coordinating node，对document进行路由，将请求转发给对应的node（有primary shard）
（3）实际的node上的primary shard处理请求，然后将数据同步到replica node
（4）coordinating node，如果发现primary node和所有replica node都搞定之后，就返回响应结果给客户端

转载于:https://my.oschina.net/mdxlcj/blog/1518797