简单介绍Hadoop当中支持的压缩算法

本文介绍了Hadoop支持的压缩算法,包括DEFLATE、gzip、bzip2、LZO、LZ4和Snappy,并详细阐述了如何在MapReduce中启用这些压缩算法,提供了代码示例和全局配置方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文件压缩他有两大好处:1.节约磁盘空间
2.加速数据在网络和磁盘的传输
现在我所用的这个Hadoop经过重新编译,可以支持所有的压缩格式
在这里插入图片描述
各种压缩算法对应使用的java类
压缩格式 对应使用的java类
DEFLATE org.apache.hadoop.io.compress.DeFaultCodec
gzip org.apache.hadoop.io.compress.GZipCodec
bzip2 org.apache.hadoop.io.compress.BZip2Codec
LZO com.hadoop.compression.lzo.LzopCodec
LZ4 org.apache.hadoop.io.compress.Lz4Codec
Snappy org.apache.hadoop.io.compress.SnappyCodec

###在Map reduce中如何开启压缩算法(两种方法)
##方法一:在代码中进行设置压缩
== Configuration conf = new Configuration();
// 设置Map使用的压缩算法
conf.set(“mapreduce.map.output.compress”,“true”);
conf.set(“mapreduce.map.output.compress.codec”,“org.apache.hadoop.io.compress.SnappyCodec”);
// 设置reduce的压缩算法
conf.set(“mapreduce.output.fileoutputformat.compress”,“true”);
c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值