1 hdfs开启HA 且hive启用连接改为HA模式
1.进入hdfs组件
2.hdfs组件中选择操作按钮
3.操作下拉列表中选择 启用high availability
4.配置service名称
5.等待启用完成
6.进入hive组件
7.hive组件选择操作按钮
8.操作下拉列表中选择更新HiveMeTastore NameNode schema
9.等待完成
2 yarn开启HA
1.进入yarn组件
2.yarn组件中选择操作按钮
3.操作下拉列表中选择 启用high availability
4.等待启用完成
3 配置域名访问
在阿里云环境下Hadoop集群必须用域名访问,不能用IP访问。
进入HDFS的configuration界面
开启如下配置dfs.client.use.datanode.hostname
4 设置物理核和虚拟核占比
一般物理核和虚拟核对比值为1:1或1:2
进入yarn配置,搜索yarn.nodemanager.resource.cpu-vcores修改配置,每台机器物理核2核虚拟成4核
5 修改单个容器下最大cpu申请资源
修改yarn.scheduler.maximum-allocation-vcores参数调整4核
6 设置每个任务容器内存大小和单节点大小
将每个任务容器默认大小从1G调大至4G,修改yarn.scheduler.maximum-allocation-mb调整每个任务容器内存所需大小
根据当前集群环境下每个节点的物理内存,修改yarn.nodemanager.resource.memory-mb调整每个节点内存所需大小
7 关闭Spark动态分配资源参数
关闭spark.dynamicAllocation.enabled参数,否则分配的资源不受控制
8 修改HDFS副本数和权限检查配置
修改dfs.re