Elasticsearch⽂档分布式存储

⽂档存储在分⽚上

  • ⽂档会存储在具体的某个主分⽚和副本分⽚上:例如 ⽂档 1, 会存储在 P0 和 R0 分⽚上
  • ⽂档到分⽚的映射算法
    • 确保⽂档能均匀分布在所⽤分⽚上,充分利⽤硬件资源,避免部分机器空闲,部分机器繁忙
    • 潜在的算法
    1. 随机 / Round Robin。当查询⽂档 1,分⽚数很多,需要多次查询才可能查到 ⽂档 1
    2. 维护⽂档到分⽚的映射关系,当⽂档数据量⼤的时候,维护成本⾼
    3. 实时计算,通过⽂档 1,⾃动算出,需要去那个分⽚上获取⽂档

⽂档到分⽚的路由算法

  • shard = hash(_routing) % number_of_primary_shards
  1. Hash 算法确保⽂档均匀分散到分⽚中
  2. 默认的 _routing 值是⽂档 id。                  
  3. 可以⾃⾏制定 routing数值,例如⽤相同国家的商品,都分配到指定的 shard
  4. 设置 Index Settings 后, Primary 数,不能随意修改的根本原因

更新⼀个⽂档

删除⼀个⽂档

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值