HDFS详解

本文详细介绍了HDFS的架构组成,包括NameNode、DataNode、SecondaryNameNode的功能及安全模式的工作原理。同时深入探讨了HDFS文件的读取与写入过程,以及副本存放策略如何提高数据可靠性和效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一::总体结构概述
1:HDFS采用Master/Slave架构对文件系统进行管理.
   各个组成部分如下及其功能如下:
    NameNode:负责存储元数据和管理目录树.这些信息是以fsimage(HDFS元数据镜像文件)和editlog两个文件形式存放在本地磁盘.当HDFS重 
                        启时根据这两个重新构造NameNode,NameNode还负责监控dataNode的健康状况.
   
    DataNode:负责储存真实的数据,以及块数据校验和

    Secondary NameNode:对元数据进行热备份(不是最重要的任务),其最重要的任务是周期性合并编辑日志中的命名空间镜像,以避免编辑日志
                                           过大;可辅助恢复NameNode;分担NameNode工作

    Client:文件切分;与NameNode交互;获取文件位置信息;与DataNode交互,读取或者写入数据;管理和访问HDFS


2:支架的概念
    (1)副本存放是HDFS可靠性和性能的关键.优化的副本存放策略正是HDFS某一重要特性之一.
    (2)支架的作用:
         ①改进数据的可靠性,可用性,和网络带宽的利用率;
         ②副本存放在不同的机架上,有效防止整个机架失效时数据丢失,并且允许读数据充分利用多个机架的带宽
         ③分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架,由多个机架上的机器共同组成一个分布式 
            集群。机架内的机器之间的网络速度通常都会高于跨机架机器之间的网络速度,并且机架之间机器的网络通信通常受到上层交换机间网络带宽的限制。
    (3)hadoop集群中副本存放准则
        具体到Hadoop集群,由于hadoop的HDFS对数据文件的分布式存放是按照分块block(64M)存储,每个block会有多个副本(默认为3),并且为了数据的安全和高效,所以
         hadoop
        默认对3个副本的存放策略为:
            第一个block副本放在和client所在的node里(如果client不在集群范围内,则这第一个node是随机选取的)。
            第二个副本放置在与第一个节点不同的机架中的node中(随机选择)。 
            第三个副本似乎放置在与第一个副本所在节点同一机架的另一个节点上
            如果还有更多的副本就随机放在集群的node里。
        这样的策略可以保证对该block所属文件的访问能够优先在本rack下找到,如果整个rack发生了异常,也可以在另外的rack上找到该block的副本。这样足够的高效,并                 
       且同 时做到了数据的容错。
       但是,hadoop对机架的感知并非是自适应的,亦即,hadoop集群分辨某台slave机器是属于哪个rack并非是只能的感知的,而是需要hadoop的管理者人为的告知hadoop    
       哪台机器属于哪个rack,这样在hadoop的namenode启动初始化时,会将这些机器与rack的对应信息保存在内存中,用来作为对接下来所有的HDFS的写块操作分配    

       datanode列表时(比如3个block对应三台datanode)的选择datanode策略,做到hadoop allocate block的策略:尽量将三个副本分布到不同的rack。

3:安全模式
    NameNode启动后会进入一个称为安全模式的特殊状态.处于安全模式的NameNode不会进行数据库的复制,NameNode接受所有DataNode心跳信号与块状态报告.块状态报告包含某个DataNode所有的数据块列表.每个数据块都有最少的副本数,当NameNode确认数据块达到这个最少值就会退出安全模式.如果不达到数量,则会复制数据库到其他DataNode上.


二:HDFS文件读取过程
    当客户端发出读取请求的时,会调用flieSystem的open方法.fileSystem是DistributedFileSystem的一个实例.之后DistributedFileSystem通过RPC协议想NameNode请求获取块的位置,此时NameNode会返回相应的块所在的DataNode地址(根据离客户端的距离排好序).
     接着DistributedFileSystem会向客户端返回一个支持文件定位的输入对象FSDataInputStream,
     FSDataInputStream连接到相应的块中,接着客户端调用read来读取相应的数据
三:HDFS文件的写入过程
    通过使用DistributedFileSystem在NameNode中创建文件,创建成功后返回一个FSDataOutputStream给客户端进行写入数据.
    当客户端写入数据时候,FSDataOutputStream将文件分割成包,放进队列,这个队列为数据队列,
    数据队列会想Namenode请求分配DataNode,返回DataNode位置后,就进行包的写入,第一个DataNode储存好后,就向第二个DataNode发送,接着第二个DataNode向第三个DataNode发送,当发送完成后,第三个DataNode返回确认信息给第二个DataNode,第二个DataNode返回确认信息给第一个DataNode,第一个DataNode返回确认信息给FSDataOutputStream,当全部写入完成就可以关闭FSDataOutputStream.

### HDFS 详解:分布式文件系统架构与原理 #### HDFS概述 HDFS(Hadoop Distributed File System)是一种专为大数据存储和处理而设计的分布式文件系统[^2]。它是Hadoop生态系统的核心组件之一,旨在解决海量数据的可靠存储和高效访问问题。 #### HDFS的设计目标 HDFS的主要设计目标包括但不限于以下几个方面: - **大文件存储**:适合存储TB甚至PB级别的超大规模文件。 - **高吞吐量**:通过批量读写操作减少网络传输开销,提升数据访问效率[^4]。 - **容错能力**:即使部分节点发生故障,也能保证系统的正常运行。 - **可扩展性**:可以通过增加硬件资源轻松扩展存储容量和性能。 #### HDFS基本架构 HDFS采用主从结构(Master-Slave Architecture),主要由以下三个核心组件构成: 1. **NameNode** NameNode是HDFS集群的大脑,负责管理整个文件系统的命名空间和元数据信息。它记录了每个文件被分割成哪些数据块(Block),以及这些数据块分布在哪个DataNode上[^3]。此外,NameNode还接收客户端请求并协调执行各种文件操作。 2. **DataNode** DataNode是实际存储数据的工作节点,在物理磁盘上保存文件的内容片段即数据块。当启动时,它们向NameNode汇报当前持有的所有块列表;之后定期发送心跳信号以维持联系状态同时更新可用空间等动态参数[^3]。 3. **Secondary NameNode** 虽然名字里带“name”,但它并非真正的名称服务器替代品而是辅助角色——主要用于周期性合并fsimage(镜像文件)与edits log日志从而减轻primary namenode负担防止内存溢出风险但不参与实时业务流程因此严格意义上不属于HA(high availability)范畴内的备用方案[^未提及]. #### 工作原理 以下是HDFS的关键工作机制描述: - **文件写入过程**: 客户端发起上传请求给namenode,后者分配block id并将该id告知相应datanodes形成pipeline链路以便后续streaming-style write;期间每完成一个chunk size大小的数据传递后立即同步副本至其他指定位置直到达到预设replication factor为止. - **文件读取过程**: 用户定位所需resource path提交query到nn获取target blocks location info随后直接连接dn拉取content而非经由中间层转发以此降低latency提高efficiency. - **数据复制机制**: 默认情况下一份data会被copy三次分别放置于不同machine之上确保即便遭遇single point failure仍能恢复original content without loss.[^not specific] - **故障检测与恢复**: dn定时上报health status report to nn so that it can promptly detect any abnormal situation like node offline or disk corruption etc., then trigger corresponding recovery actions such as re-replicating lost chunks elsewhere within cluster boundaries accordingly.[^also not clear here] #### 性能优化特点 除了基础功能外,hdfs还有诸多针对特定场景做了专门调优的地方比如: - 支持rack awareness configuration which helps balance load across multiple racks thereby reducing inter-rack traffic costs significantly while enhancing fault tolerance at the same time.[^no exact source provided yet] - Implementing short-circuit reads when possible allows bypassing normal network channels between client and remote datanodes thus achieving faster local access speeds under certain conditions where both parties reside on identical physical hosts/machines.[^again no direct citation available currently] ```python # 示例代码展示如何简单交互hdfs api from hdfs import InsecureClient client = InsecureClient('http://localhost:9870', user='hadoop') with client.write('/example.txt') as writer: writer.write(b'Hello World\n') result = client.read('/example.txt').decode() print(result) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值