HDFS的读写流程

原创已于 2024-12-04 21:39:32 修改 · 507 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hdfs #hadoop #大数据

于 2024-12-04 21:32:44 首次发布

一、hdfs写数据流程

（1）客户端向namenode发出写数据请求，namenode会对用户写权限+写入目录树路径是否存在两者进行校验，校验通过则响应可以上传文件；

（2）客户端请求上传第一个block文件块（128M)，请求namenode返回写入的datanode

（3）假设是三副本机制，则namenode会返回dn1、dn2、dn3三个节点，表示可以采用这三个节点存储数据（namenode选取datanode时综合考虑距离最近和负载均衡）

（4）客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，依次dn2调用dn3，三者之间建立Block传输通道完成

(5) dn1、dn2、dn3逐级应答客户端

（6）客户端开始往dn1上传第一个Block，上传时先将数据从磁盘读取放到一个本地内存缓存，以Packet为单位上传至dn1，dn1收到一个packet后沿着通信管道逐级传递至dn2、dn3；dn1每传一个packet会放入一个应答队列等待应答

（7）当一个block传输完成后，客户端再次请求namenode上传block2，重复步骤2-6

二、hdfs读数据流程

（1）客户端向namenode发送请求，namenode校验权限和路径通过后，查询目标文件的元数据，返回其所在的datanode地址

（2）客户端通过FSDataInputStream模块，并综合考虑就近原则和负载均衡，选择一个datanode节点，请求读取数据

（3） datanode传输数据给客户端，并以packet为单位进行校验

(4) 客户端以packet为单位接收，先在本地进行缓存，然后写入目标文件

（5）注意当一个文件在存储的时候不止一个block，那么在读取的时候时串行读，即读完block1后再读取block2，保证顺序

博客等级

码龄4年

41
原创

391
点赞

251
收藏

238
粉丝

关注

私信

热门文章

分类专栏

上一篇：: Flink的容错机制总结

下一篇：: 数据库设计规范——范式

最新评论

MySQL 8.0 新特性 —— 窗口函数详解
优快云-Ada助手: 恭喜您撰写出了第14篇博客，内容围绕MySQL 8.0新特性窗口函数进行了详细解说，让读者受益匪浅。希望您能继续保持创作的热情和耐心，为大家带来更多有价值的内容。下一步建议可以考虑深入探讨数据库优化技巧或者结合实际案例进行分析，让读者更好地理解和运用知识。期待您更多精彩的作品！
MySQL 8.0 新特性 —— 窗口函数详解
优快云-Ada助手: 恭喜您发布了第14篇博客，“MySQL 8.0 新特性 —— 窗口函数详解”，内容十分精彩！窗口函数是一个很有深度的主题，您的详细解读让读者受益匪浅。希望您能继续保持创作热情，探索更多MySQL 8.0的新特性，或者可以考虑结合实际案例进行分析，让读者更好地理解和运用这些新特性。期待您的下一篇博文！
Decimal模块对dataframe列进行四舍五入
优快云-Ada助手: 亲爱的作者，恭喜您撰写了这篇关于Decimal模块对dataframe列进行四舍五入的博客！您的分享让我受益匪浅。希望您能继续保持创作的热情，分享更多关于数据处理的技巧和经验。或许下一步可以考虑分享如何利用Decimal模块进行数据舍入的高级技巧，或者探讨其在其他数据处理领域的应用。期待您更多精彩的文章！
mysql中的group_concat函数用法
优快云-Ada助手: 恭喜您写了第12篇博客！标题“mysql中的group_concat函数用法”非常吸引人。您对mysql的函数用法有着深入的了解和研究，这让我非常欣赏。希望您能继续保持创作的热情和努力，分享更多有关数据库的知识。作为下一步的创作建议，我想提议您可以探索一些高级的mysql函数用法，或是介绍一些在实际项目中常用的数据库优化技巧。这些内容会对读者来说非常有价值，也对您自身的技术提升有很大帮助。再次恭喜您，期待您更多精彩的博客！
mysql 计算字符串长度方法 char_length(str) 和 length(str)
优快云-Ada助手: 恭喜你写了这篇关于mysql计算字符串长度方法的博客，内容很详细，对读者很有帮助。不过我觉得下一步可以尝试写一些实际应用场景，比如在实际开发中如何选择合适的字符串长度方法，或者结合其他函数进行更复杂的数据处理等方面的内容，这样可以让读者更好地理解并应用这些方法。希望你能继续保持创作，加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。