HDFS 的读写流程

明明不会打代码

于 2024-05-20 16:08:05 发布

阅读量251

点赞数 2

文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_62336238/article/details/139067980

版权

写数据：

1.hdfs 向 Namenode 请求上传文件；😀

2.NameNode 检查目标文件是否已存在，父目录是否存在，没问题响应可以上传文件

3. 客户端 hdfs 请求上传第一个 bloke，请求返回 DataNode

4.NameNode 返回 dn1,dn2,dn3, 表示采用这三个节点存储数据

优化 Tip: 副本存储节点时优先选择本地节点，其次选择一个机架上的节点，（追求节点距离最近）；除此之外，还要考虑负载均衡的问题，当检测到节点数据过多时，会将数据传输到另外一个节点距离较近的 DataNode.

5.hdfs 请求建立 Bloke 传输通道，先通过 dn1,dn1 接受到请求会调用 dn2，然后 dn2 调用 dn3. 搭建完成数据传输通道。

6.dn3,dn2,dn1 逐级应答

7.hdfs 开始传输 bloke 到 dn1，dn1 接受到后，一份数据在磁盘写入，一份数据传输给 dn2

bloke 传输的最小单位 packet (64K):hdfs 写到数据流中时，会先创建一个缓冲队列 chunk512byte+chunksum (校验位) 4byte 缓冲队列攒到 64k 形成 Packet

packet 形成后会被发送到一个个的 DataNode

8.packet 被 dataNode 接受成功后，dn 会给出应答成功，返回给 hdfs，

tip:packet 在发送时，还会有一个缓冲队列 ACK, 在 hdfs 接受到 dn 的应答成功信号后，缓冲队列才会被删除回收。

读流程

1.hdfs 请求下载文件向 NameNode

2.NameNode 查询是否有数据，有则返回目标文件的元数据

3.hdfs 向 dataNode1 发送读数据请求 blk_1,

发送第二个读数据请求时如果发现 dataNode1 处理的数据量已经足够大，hdfs 就会向 dataNode2 发送 blk_2。（负载问题的考虑，不止节点距离的考虑）

4.hdfs 获取到 dataNode 发送过来的数据后，进行串行读入数据

dn3

dn2

dn1

明明不会打代码

博客等级

码龄4年

31
原创

197
点赞

125
收藏

165
粉丝

关注

私信

热门文章

最新评论

LookUpJoin
优快云-Ada助手: 恭喜您发布了新的博客“LookUpJoin”！持续创作是非常了不起的事情，您对这个主题的探索和分享无疑会让更多人受益。或许接下来可以考虑加入一些实例分析或者案例研究，更具体地展示“LookUpJoin”的应用场景和效果，让读者更容易理解和应用。期待您的下一篇作品！
数仓建模用的什么模型
优快云-Ada助手: 恭喜您发布了第18篇博客！标题“数仓建模用的什么模型”引人深思，内容必定精彩。在数仓建模领域，选择合适的模型确实至关重要。希望您能继续保持创作的热情和努力，探索更多关于数仓建模的知识，并分享给更多的读者。或许下一步可以深入探讨各种模型的优缺点，以及在实际应用中的比较与选择。期待您更多精彩的文章！
HIVE 和 join 有关的优化问题
优快云-Ada助手: 恭喜您发布了第19篇博客，这是一个了不起的里程碑！对于HIVE和join相关的优化问题的探讨，您的文章内容十分有价值，对读者来说无疑是一次知识的盛宴。接下来，我建议您可以继续深入研究HIVE和join的优化策略，或者探讨一些实际案例，为读者提供更多实用的技术指导。期待您更多精彩的创作！
Zookeeper 常用的一些命令
优快云-Ada助手: 恭喜您发布了第20篇博客，标题为“Zookeeper 常用的一些命令”，内容相信对读者们会有很大帮助。您的持续创作精神令人钦佩！接下来，我建议您可以尝试深挖Zookeeper的一些高级功能，或者分享一些实战经验，让读者们能够更加全面地了解和运用Zookeeper。期待您更多精彩的博客！
QQ，微信小惊喜代码
Eason_LYC: 这个好吧欢迎回访关注

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。