HDFS文件上传流程

本文详细介绍了HDFS中文件的上传过程,包括客户端如何与NameNode交互确定数据块存储位置,以及DataNode如何进行数据块的存储及备份。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HDFS运行流程图(图是盗的)

      首先用户即客户端想要上传文件,就先要给namenode发个请求,告诉它说我要上传文件了(即写数据),然后namenode会返回一个响应,这个响应是namenode根据自身情况,比如会先查一下namenode里面还能存数据吗?能存多少?有几个datanode能存?(心跳信息)然后返回一个可以存储的节点列表,意思是这些里面能存,但不是能存的datanode全部返回,它会根据上传文件的大小来适当的返回,客户端收到这个列表后,就向根据返回的列表里面的datanode中写数据,文件会分为多个块(block),写的过程是以流的方式写入的,一个块存入一个DataNode,存完后DataNode就会备份,我们默认的备份数是3,存完后,会告诉namenode说我存完了。这样就结束了hdfs文件上传的流程。


详细文字解释:

           1.   客户端拿到一个文件,跟namenode说,我要上传这个文件,上传到哪个目录下。我们假设这个文件名为 cjk.avi,目录为 /hadoop/hdfs/

           2.   namenode拿到这个文件后,获取文件名,然后去元数据中查找/hadoop/hdfs/中是否已经存在相同文件名的文件,如果没有,那么告诉客户端说你可以上传这个文件

           3.   客户端接到可以上传文件的命令后,会将文件进行切分(hadoop2.X128M),切分成NN>=1)块,如果切成n块,那么除去最后一个,其它块的大小都是一样的。

           4.   客户端拿到第一个块block01后,跟namenode说,我要上传block01,然后namenode去自身的datanode信息池中查找应该上传到哪几个datanode(备份数)中,然后将查询到的datanode的信息告诉客户端

         5.   客户端拿到datanode的信息后,开辟一个socket流将block01上传到namenode返回的datanode中最近的一个datanode节点,然后这个datanode节点会对block01进行水平备份,也就是将数据从datanode本地复制到其他指定的机器上。

           6.   datanode将数据水平备份完成之后,会通知客户端,说block01上传成功

           7.   然后客户端会通知namenodeblock01上传成功,此时namenode会将元数据(可以简单地理解为记录了block块存放到哪个datanode中)同步到内存中

           8.   其他的block块循环上面的过程

          9.   至此一个大文件就上传到hdfs中了



  

HDFS(Hadoop Distributed File System)是Apache Hadoop的一部分,是一个可扩展的分布式文件系统,用于存储和处理大型数据集。HDFS上传文件流程如下: 1. 客户端向NameNode发出上传请求,并提供要上传文件路径和文件块大小等信息。 2. NameNode接收到客户端的上传请求后,首先检查该文件是否已经存在于HDFS中,如果存在则返回错误信息,否则在内存中创建该文件的元数据信息,并返回给客户端一个DataNode列表。 3. 客户端根据返回的DataNode列表,选择一个DataNode作为数据块的上传目标,并向该DataNode发出上传请求。 4. DataNode接收到客户端的上传请求后,创建一个临时文件用于存储上传的数据块,并返回一个用于后续数据块传输的随机端口号。 5. 客户端通过随机端口号与DataNode建立Socket连接,并向DataNode传输数据块。 6. DataNode接收到客户端传输的数据块后,将该数据块写入临时文件中,并返回上传成功的响应信息。 7. 客户端在完成对数据块的上传后,向NameNode发送一个完成上传的请求,NameNode接收到该请求后,将所有数据块的信息保存在该文件的元数据信息中,并将元数据信息持久化到磁盘中,从而完成整个文件上传过程。 需要注意的是,如果上传文件大小超过了HDFS的块大小,则会将文件分成多个数据块进行上传,每个数据块都会分别上传到不同的DataNode上,并且每个数据块上传完成后都需要向NameNode发送一个完成上传的请求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值