MapReduce Job调试教训

本文分享了在遇到Map任务运行40分钟后Reduce任务挂起的情况,并提供了调试MapReduce作业的有效步骤,包括本地单测、使用cat命令测试Mapper和Reducer等。

[2014.12.08]
一个Job, Map跑了40分钟,Reduce挂了;fix bug, 重跑,Reduce又挂了,......,三个小时过去了,又再重跑,时间啊。。。。
以后,调试MR Job, 老老实实按以下方法:
(1)先本地单测通过,
(2)mapper 为自己的逻辑,然后 -reduce='cat';
(3)从hdfs上取一个reduce产出的part, 在本地 cat part|python reduce.py 测试通过
(4)上集群跑MR Job

转载于:https://www.cnblogs.com/basalt/p/4151619.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值