Hadoop从2.3.0版本开始支持HDFS缓存机制,HDFS允许用户将一部分目录或文件缓存在HDFS当中,NameNode会通知拥有对应块的DataNodes将其缓存在DataNode的内存当中
集中式缓存管理有着许多显著的优势:
- 防止那些被频繁使用的数据从内存中清除
- 因为
HDFS从2.3.0版本引入了缓存机制,由NameNode集中管理DataNode的内存缓存,提升数据读取效率。缓存管理能防止常用数据被清除,提高内存利用率,并通过zero-copy读API加速读取。适用于频繁访问的文件,如Hive的fact表,有助于提升混合作业的SLA性能。
Hadoop从2.3.0版本开始支持HDFS缓存机制,HDFS允许用户将一部分目录或文件缓存在HDFS当中,NameNode会通知拥有对应块的DataNodes将其缓存在DataNode的内存当中
集中式缓存管理有着许多显著的优势:
1043
1066

被折叠的 条评论
为什么被折叠?