副本放置策略
数据是以块存储在datanode节点
第一个副本:假设我提交文件的所在机器就是datanode节点,那么第一个块就存储在本节点上;
如果不是,就随机挑选一台磁盘不太慢的 cpu不太繁忙的节点上;
第二个副本:放置在于第一个副本的不同的机架的节点上
第三个副本:与第二个副本相同的机架的不同的节点上

RCK1,RCK2为机架,蓝色填充区为副本,C为客户端
本文详细解析了Hadoop中数据块的副本放置策略:首个副本优先放置于提交文件的节点,若不可则选择磁盘与CPU资源充足的节点;次副本放置于不同机架的节点上,第三副本则位于同一机架的不同节点。
副本放置策略
数据是以块存储在datanode节点
第一个副本:假设我提交文件的所在机器就是datanode节点,那么第一个块就存储在本节点上;
如果不是,就随机挑选一台磁盘不太慢的 cpu不太繁忙的节点上;
第二个副本:放置在于第一个副本的不同的机架的节点上
第三个副本:与第二个副本相同的机架的不同的节点上

RCK1,RCK2为机架,蓝色填充区为副本,C为客户端

被折叠的 条评论
为什么被折叠?