- 博客(1)
- 收藏
- 关注
原创 记一次MapReduce的内存溢出
背景: 最近使用MapReduce做离线数据清洗,在map段做简单的数据过滤,有经纬度的发送到reduce端,没经纬的过滤掉。reduce端将数据整理出来,按业务模型拼接成字符串写入HDFS。供hive作为外表进行后续数据处理分析。 问题: 该批数据总共2T大小,MapReduce执行第一次时,不出意料的崩溃了。每次都大概在map阶段执行到61%左右。 排查: 查看日志发现果然内存溢出:java.lang.OutOfMemoryError: GC overhead limit exceeded。
2020-07-31 19:10:02
1321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅