hadoop使用lzo压缩

本文详细介绍了如何安装并配置lzo和lzop开发包,使用git从GitHub下载hadoop-lzo源码进行编译,集成到Hadoop环境,实现对特定文件类型提供更高效的压缩与解压功能。包括单机创建索引和使用MapReduce作业批量创建索引的方法,以提升数据处理效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、安装lzo开发包
sudo apt-get install liblzo2-dev

2、安装lzop
sudo apt-get install lzop

3、编译hadoop-lzo.jar
用git在此页面下载源码
https://github.com/kevinweil/hadoop-lzo

编译环境
32位os
export CFLAGS=-m32 
export CXXFLAGS=-m32
ant compile-native tar

64位os
export CFLAGS=-m64 
export CXXFLAGS=-m64
ant compile-native tar

成功编译后,hadoop-lzo*.jar在build文件夹中

cp hadoop-lzo-0.4.13.jar $HADOOP_HOME/lib/


core-site.xml

<property>
<name>io.compression.codecs</name>
<value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec
</value>
</property>
<property>
<name>io.compression.codec.lzo.class</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>


给lzo文件创建索引,例如big_file.lzo文件
单机上创建索引:
hadoop jar /path/to/your/hadoop-lzo.jar com.hadoop.compression.lzo.LzoIndexer big_file.lzo

用map-reduce job创建索引:
hadoop jar /path/to/your/hadoop-lzo.jar com.hadoop.compression.lzo.DistributedLzoIndexer big_file.lzo
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值