HDFS副本机制

HDFS副本策略与配置详解
本文介绍了HDFS的数据备份机制,重点讨论了低版本Hadoop如2.7.2的副本节点选择策略。每个文件block默认有三个副本,副本数可配置以增强数据安全性。在hdfs-site.xml中修改配置可调整副本数。早期版本中,第一个副本在客户端节点,第二个副本在不同机架的随机节点,第三个副本在相同机架的随机节点。而在Hadoop2.7.2,第二个副本则与第一个副本位于相同机架。

HDFS副本机制

目标:掌握HDFS的数据备份机制(数据副本)

HDFS视硬件错误为常态,硬件服务器随时有可能发生故障。

为了容错,文件的所有 block 都会有副本。每个文件的 block 大小和副本系数都是可配置的。应用程序可以指定某个文件的副本数目。副本系数可以在文件创建的时候指定,也可以在之后改变。

数据副本默认保存三个副本,我们可以更改副本数以提高数据的安全性

在hdfs-site.xml当中修改以下配置属性,即可更改文件的副本数

<property>
      <name>dfs.replication</name>
      <value>3</value>
</property>

低版本Hadoop副本节点选择:

  1. 第一个副本在client所处的节点上。如果客户端在集群外,随机选一个。
  2. 第二个副本和第一个副本位于不相同机架的随机节点上。
  3. 第三个副本和第二个副本位于相同机架,节点随机。

在这里插入图片描述

Hadoop2.7.2副本节点选择:

  1. 第一个副本在client所处的节点上。如果客户端在集群外,随机选一个。
  2. 第二个副本和第一个副本位于相同机架,随机节点。
  3. 第三个副本位于不同机架,随机节点。

在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值