总结下HDFS的设计特点
超大文件,指几百MB,几百GB甚至几百TB大小的文件
流式数据访问,HDFS的构建思路为:一次写入、多次读取是最高效的访问模式
商用硬件,不需要运行在昂贵且高可靠的硬件上
低时间延迟的数据访问,应用与低时间延迟的数据访问场景,记住,HDFS是为高数据吞吐量应用优化的
大量的小文件,由于namenode将文件系统的元数据存储在内存中,因此该文件系统所能存储的文件总数受限于namenode的内存总量
多用户写入;任意修改文件,HDFS文件中只有一个writer,而且写操作总是将数据添加到文件的末尾。它不支持多个写入者的操作,也不支持在文件的任意位置进行修改