HDFS的产生背景:
现在的数据增长速度非常快,随着数据量越来越大,一台计算机来存储数据就显得很吃力,那么就把数据存放在多台计算机上,但是这样非常的不便于对数据的管理和维护。所以迫切的需要一种系统来管理多台计算机上的数据。这就是分布式 文件管理系统。这里所介绍的HDFS就是其中一种。
HDFS是什么?
看完第一段话想必大家都已经知道了,HDFS就是一个分布式的文件系统。这个文件系统,用来存储文件,通过目录树来定位文件。为什么说是分布式的,因为它是 由许多服务器联合起来来实现其功能,集群中的服务器各有各的角色。
HDFS的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,不适合用来做网盘。
其优缺点:
优点
1.高容错性,数据保存成多个副本。他通过增加副本的的形式来提高容错性;某个副本丢失后可以自动恢复副本到另一个节点。
2.适合处理大量的数据
3.通过多副本机制,提高可用性。
缺点
1.不适合低延时访问,比如毫秒级的存储数据是做不到的。
2.无法高效的对大量小文件进行存储。
3.不支持文件的并发写入和随机修改。也就是一个文件不允许多个线程同时写,仅支持数据的追加,已存在的数据不能够进行修改。
1718

被折叠的 条评论
为什么被折叠?



