HDFS读写数据流程详解

首先通过一幅漫画来了解一下(很经典的一幅图,从网上找的)

写数据到HDFS:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

从HDFS上读数据:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

HDFS优点:
数据冗余,硬件容错
处理流式(一次写入,多次读取的操作)的数据访问
面向大规模数据集,能够进行批处理、能够横向扩展
适合存储大文件
构建在廉价机器上,成本较低
缺点:
不支持低延迟的数据访问
不适合大量小文件的存储(元数据meta data占用内存过大导致NameNode压力也越大)
不支持并发写入,一个文件只能有一个写入者
不支持文件随机修改,仅支持追加写入

更多内容可以了解
https://blog.youkuaiyun.com/github_36444580/article/details/77840481
https://blog.youkuaiyun.com/qq_26442553/article/details/78529212
https://blog.youkuaiyun.com/whdxjbw/article/details/81072207

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值