HDFS概述

HDFS的产生背景:

现在的数据增长速度非常快,随着数据量越来越大,一台计算机来存储数据就显得很吃力,那么就把数据存放在多台计算机上,但是这样非常的不便于对数据的管理和维护。所以迫切的需要一种系统来管理多台计算机上的数据。这就是分布式 文件管理系统。这里所介绍的HDFS就是其中一种。

HDFS是什么?

看完第一段话想必大家都已经知道了,HDFS就是一个分布式的文件系统。这个文件系统,用来存储文件,通过目录树来定位文件。为什么说是分布式的,因为它是 由许多服务器联合起来来实现其功能,集群中的服务器各有各的角色。

HDFS的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,不适合用来做网盘。

其优缺点:

优点

1.高容错性,数据保存成多个副本。他通过增加副本的的形式来提高容错性;某个副本丢失后可以自动恢复副本到另一个节点。

2.适合处理大量的数据

3.通过多副本机制,提高可用性。

缺点

1.不适合低延时访问,比如毫秒级的存储数据是做不到的。

2.无法高效的对大量小文件进行存储。

3.不支持文件的并发写入和随机修改。也就是一个文件不允许多个线程同时写,仅支持数据的追加,已存在的数据不能够进行修改。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值