Hive压缩
(一)Map输出阶段压缩方式
(1)开启Hive的压缩功能
set hive.exec.compress.intermediate = true;
(2)开启Map传输数据的压缩功能
set mapreduce.map.output.compress = true;
(3)设置压缩方式
set mapreduce.map.output.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;
(二)Reduce输出阶段压缩方式
(1)开启Hive的压缩功能
set hive.exec.compress.output = true;
(2)开启Reduce输出数据的压缩功能
set mapreduce.output.fileoutputformat.compress = true;
(3)设置压缩方式
set mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;
(4)设置压缩类型
set mapreduce.output.fileoutputformat.compress.type = BLOCK;
本文详细介绍了如何在Hive中配置Map和Reduce阶段的数据压缩,包括开启压缩功能、选择压缩方式和设置压缩类型的具体步骤,使用SnappyCodec进行高效数据处理。
1万+

被折叠的 条评论
为什么被折叠?



