HDFS写数据的流程

最新推荐文章于 2024-11-18 14:59:36 发布

原创最新推荐文章于 2024-11-18 14:59:36 发布 · 136 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

hadoop 专栏收录该内容

20 篇文章

订阅专栏

本文详细描述了在Hadoop分布式文件系统中，客户端如何将数据写入NameNode指定的DataNode节点，包括数据切块、副本分配、数据流建立以及确认写入完成的过程，展示了Hadoop的副本策略和数据可靠性机制。

1、客户端：namenode 我要写数据！我写的数据名字叫/test/a.txt 我有三个副本，按照128M切块

2、namenode：我查过了，你这个目录存在可以写入（你这个文件都没有写个P）

3、客户端: 我要写第一个文件了

4、namenode：好的，给你三个机器，dream1，dream2，dream3 往这里写吧，而且blockId=7740,你们写块的时候都要带上blockId=7740的标识

经过一个交换机我们称为1跳

客户端----->交换机A------->dream1 ：我们成为1跳

客户端----->交换机A------->dream2：我们成为1跳

客户端----->交换机A------->交换机C-------->交换机B---------->dream3 ：我们成为3跳

5、客户端：dream1，dream2，dream3，我到dream1、dream2、dream4有一跳，到dream3有三跳，那我往dream1写了。我得把我的副本地址和blockId都告诉他，让他们建立好PIPELINE

6、dream1的datanode：收到，你还要写到dream2和dream3吗，我这就告诉dream2，我写给dream2，让dream2写给dream3，我们几个datanode通起来 ----数据流建立完成后---- 客户端我们准备好了你写吧

7、客户端：好的datanode(dream1)，开搞

8、datanode：传输完成数据流关闭了。

重复3-8

9、客户端：namenode我写完了，你确认一下

10、确认完闭,副本数量正常（不正常我会帮你复制的）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。