Hive参数优化

本文详细介绍了基于Hive2.x的Hadoop集群优化配置,包括HDFS副本数、CPU配置、内存设置、本地目录管理、MapReduce内存调整、HiveServer2堆栈优化、并行编译、动态分区线程数、监听输入文件线程数、Map与Reduce输出压缩、中间数据及最终结果压缩等关键参数。通过这些优化,可以显著提升大数据处理效率和系统性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此教程中关于Hive的优化,皆是基于Hive2.x的版本,对于Hive1.x旧版本的优化机制不再复述(新版本已改善或变更)。另外新版本中默认为开启状态的优化配置项,在工作中无需修改,也不再复述。

一、HDFS副本数

  • 配置项:dfs.replication ( HDFS)
  • 介绍:文件副本数,通常设为3,不推荐修改。
    在这里插入图片描述

二、CPU配置

  • 查看CPU线程数

    grep 'processor' /proc/cpuinfo | sort -u | wc -l
    

    在这里插入图片描述

  • 配置项:yarn.nodemanager.resource.cpu-vcores

  • 表示该节点服务器上yarn可以使用的虚拟CPU个数,默认值是8,推荐将值配置与物理CPU线程数相同,如果节点CPU核心不足8个,要调小这个值,yarn不会智能的去检测物理核心数。
    -
    在这里插入图片描述

三、内存配置

  • 配置项:yarn.nodemanager.resource.memory-mb
  • 设置该nodemanager节点上可以为容器分配的总内存,默认为8G,如果节点
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值