use adst;
set mapreduce.job.queuename=${hiveconf:mp_queue};
set mapreduce.reduce.java.opts=-=-Xmx10000m;
set mapred.reduce.tasks=5;
set mapred.min.split.size.per.node=3200000;
set mapred.min.split.size.per.rack=3200000;
set mapred.max.split.size=25600000;
set hive.auto.convert.join=true;
set hive.groupby.skewindata=true;
set hive.mapjoin.smalltable.filesize=25000000;
set hive.map.aggr=true;
set hive.exec.orc.default.stripe.size=268435456;
set hive.exec.max.dynamic.partitions=100000;
set hive.exec.max.dynamic.partitions.pernode=100000;
set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=10;
set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.reducers.bytes.per.reducer=107374182;
set orc.compress.size=4096;
1. Hive 中select除了某些字段之外的剩余所有字段
-- 选择tableName表中除了name、id、pwd之外的所有字段

本文介绍了Hive的配置优化技巧,包括设置MapReduce作业队列、内存参数、分区策略等,以提升查询效率。同时,展示了如何使用HQL选择除特定字段外的所有字段,并显示表头。这些优化措施对于大数据处理场景下的性能提升至关重要。
最低0.47元/天 解锁文章
8451

被折叠的 条评论
为什么被折叠?



