进一步走近HDFS

最新推荐文章于 2025-04-27 01:15:23 发布

lambda33

最新推荐文章于 2025-04-27 01:15:23 发布

阅读量2.5k

点赞数

分类专栏： Hadoop 文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_57382185/article/details/123483912

版权

1.定义

HDFS是Hadoop Distribute File System的缩写，它是Google公司的GFS分布式文件系统的开源实现，是Apache Hadoop项目的一个子项目。支持海量数据的存储，成百上千的计算机组成存储集群，HDFS可以运行在低成本的硬件之上，具有的高容错、高可靠性、高可扩展性、高吞吐率等特征，非常适合大规模数据集上的应用。

1.1优点

数据冗余，高容错性 数据自动保存多个副本副本丢失后，自动恢复可构建在廉价机器上
流式文件访问 一次性写入，多次读取保证数据一致性
适合大数据处理 GB、TB、甚至PB级数据
适合批处理 吞吐量高

1.2缺点

不适合低延迟数据访问 比如毫秒级低延迟与高吞吐率
不适合小文件存取 占用NameNode大量内存寻道时间超过读取时间
不适合并发写入、文件随机修改 一个文件只能有一个写入者仅支持append

2.HDFS组成与架构

1.NameNode的职责(Master)

管理维护HDFS

接收客户端的请求：上传、下载、创建目录等

维护了两个非常重要的文件:edits日志文件和fsimage镜像文件

HDFS的元信息

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

lambda33 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。