HDFS 文件系统NameSpace、副本机制

本文详细介绍了HDFS的文件系统NameSpace概念,包括目录结构、文件操作、权限管理及副本机制。深入探讨了HDFS如何通过块级别的数据复制确保数据的高可用性和容错性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文件系统NameSpace

HDFS支持传统的层次型目录结构,用户或客户端可以创建目录,并且可以存储文件在这些目录中。HDFS的这种目录层次结构与其他的文件系统非常类似,可以进行创建文件、移动文件、删除文件等操作。还支持不同用户不同目录访问权限。
NameNode维护的是文件系统的NameSpace,对文件系统的任何修改或者属性的修改都会被NameNode记录下来,应用程序可以指定文件的副本个数,每个文件都有自己对应的副本系数,这个副本系数也存储在NameNode上。

HDFS副本机制

上面介绍了HDFS的副本系数,那么到底是如何实现副本的?
HDFS可以在集群中存储非常大的文件,将每个文件都存储一系列的blocks。如果一个文件大于128MB,那么会自动切分这个文件。为了容错,这些Block是以副本的形式存储在集群中。每个文件都有可以设置Block的大小和副本的个数。
每个文件所有的Block大小除了最后一个BLock其余Block的大小都是固定的。
HDFS在文件创建时就可以指定副本系数,也可以在之后进行改变。
在这里插入图片描述
如上图所示,NameNode存储了FileName,numReplicas,block-ids。
/users/sameerp/data/part-0这个文件的副本系数是2,block-id是1和3
/users/sameerp/data/part-1这个文件的副本系数是3,block-id分别是2、4和5
当某台节点挂掉之后,数据依旧可以正常访问。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值