MapReduce过程卡在reduce处的67%
原网址:
https://stackoverflow.com/questions/19592744/hadoop-reduce-stops-running
reduce过程的百分比与对应的处理如下:
- 0~33%是shuffle的过程,数据从mapper已到了reducer
- 33~67%是sort的过程,这个过程只会在mapper完成后才会执行
- 67~100%才是reducer程序执行的过程。如果reduce卡在了67%,那么说明reducer一个也没有执行。可能是输入数据太大,超过了限制,也可能是reducer有死循环的bug

本文解析了MapReduce过程中reduce阶段出现停滞的原因,通常在67%时停滞表明reducer未开始执行。文章分析可能由于数据量过大或reducer存在死循环等问题导致。
1876

被折叠的 条评论
为什么被折叠?



