与Hadoop 2.x相比,它有一些新的特性如下:
-
基于JDK 1.8
-
HDFS可擦除编码
-
MR Native Task优化
-
基于Cgroup的内存隔离和IO Disk隔离
-
更改分配容器资源Container resizing
-
……
Hadoop 3 HDFS的架构
HDFS集群架构包含如下:NameNode、DataNode、Secondary NameNode
-
NameNode
接收客户端的读写服务
-
DataNode
简称为DN,主要用来存储数据内容。本地磁盘目录存储数据块Block,以文件形式分别存储在不同的DataNode节点上,同时存储Block的元数据信息文件
-
Secondary NameNode
NameNode把元数据存储在内存中,为了保证数据不丢失,需要把数据保存起来,这里的文件包含fsimage和edits。fsimage是整个元数据文件,在集群刚开始搭建的时候时空的,对元数据增删改的操作放在edits文件中,Secondary NameNode完成数据的合并操作,每隔3600秒更新一次
Hadoop 3配置
-
部署配置
Hadoop的配置涉及到以下几个文件:hadoop-env.sh、core-site.xml、hdfs-site.xml、works
hadoop-env.sh:表示Hadoop运行环境变量配置
core-site.xml:公共属性配置文件
hdfs-site.xml:HDFS属性配置文件
works:DataNode分布配置
2. 配置 hadoop
&n

本文详细介绍了Hadoop3.x相较于2.x的新特性,包括基于JDK1.8的支持、HDFS可擦除编码、MRNativeTask优化等,并深入解析了Hadoop3的HDFS架构和配置流程,涵盖了NameNode、DataNode、SecondaryNameNode的角色及其配置要点。
最低0.47元/天 解锁文章
1796

被折叠的 条评论
为什么被折叠?



