cdh4.6.0升级测试1

本文分享了从CDH4.2.0升级到4.6.0的实践经验,包括解决jt内存泄露等bug,并通过impala、hive和flume测试验证了数据准确性和性能稳定性。
线上使用了cdh4.2.0,这个版本有几个比较严重的bug,jt 内存泄露和distribute cache阻塞的bug.
(MAPREDUCE-2479和MAPREDUCE-5508)
相关patch:
最近计划升级至4.6.0,,对4.6.0和4.2.0做了相关的对比测试
数据校验和组件兼容性测试:
测试方法:

1impala测试升级前后数据准确性和性能

结论:

前后结果完全一样(select * order by /count(1) /count(1)+group by

性能变化不大。

wKiom1NX1iGT-U0MAACAlQs1qVk578.jpg

2hive测试升级前后数据准确性和性能(因为时间有限,没有做TPC的测试)

(text gz/rcfile/sequencefile)

load 4Gtext gz文件,分布清洗成rcfilesequencefile

结论:

hive测试数据正常(count(1) /count(1)+group by

性能变化不大,其中因为从text gz清洗至rcfilesequencefile时不能split,只能一个map做处理,耗时比较长,没有取多次的平均值。

其他数据是取多次的平均值。

wKiom1NX1xjAOIR0AADbX35NLsc377.jpg

3flume测试写入

升级前后flume hdfs sink有效性。

结论:

升级前后flume写入hdfs正常,可以直接使用4.2.0hadoop lib做写入操作。



本文转自菜菜光 51CTO博客,原文链接:http://blog.51cto.com/caiguangguang/1401406,如需转载请自行联系原作者

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值