网络拓扑:
在海量数据处理中,其主要限制因素是节点之间数据的传输速率—带宽很稀缺。这里的想法是将两个节点间的带宽作为距离的衡量标准
节点距离:
两个节点到达最近的共同祖先的距离总和
机架感知
官方ip地址:
http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-common/RackAwareness.html
在低版本Hadoop副本节点的选择
第一个副本在client所处的节点上,如果客户端在集群外,随机选择一个
第二个副本和第一个副本位于不相同机架的随机节点上
第三个副本和第二个副本位于相同的机架,节点随机
如图所示:
Hadoop2.7.2(本人hadoop版本)副本节点选择:
第一个副本在client所处的节点上,入股哦客户端在集群外,随机选择一个
第二个副本和第一个副本位于相同机架,随机节点
第三个副本位于不同机架,随机节点
如图所示: