MR参数:
set mapreduce.job.queuename=queue_name; #设置作业提交队列
set hive.execution.engine=mr; #设置计算引擎
set mapreduce.map.memory.mb=4096; #设置map内存
set mapreduce.map.java.opts=-Xmx3276; #设置map jvm内存(小于map内存)
set mapreduce.reduce.memory.mb=4096; #设置reduce内存
set mapreduce.reduce.java.opts=-Xmx3072; #设置reduce jvm内存(小于reduce内存)
#文件切分
set dfs.block.size = 256000000; #设置每个block的大小,控制map数
#合并小文件
#Map输入合并小文件
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; #执行Map前进行小文件合并
set mapred.max.split.size=256000000; &n

本文介绍了在Hive中使用MapReduce执行引擎时的关键参数配置,包括设置作业提交队列、内存分配、文件切分、小文件合并、数据倾斜处理、动态分区及并行执行等,旨在优化Hive查询性能和效率。
最低0.47元/天 解锁文章
289

被折叠的 条评论
为什么被折叠?



