spark
zhuge134
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark性能调优之Shuffle调优总结
Spark性能调优之Shuffle调优 • Spark底层shuffle的传输方式是使用netty传输,netty在进行网络传输的过程会申请堆外内存(netty是零拷贝),所以使用了堆外内存。 • shuffle过程中常出现的问题 常见问题一:reduce oom? 问题原因: reduce task 去map端获取数据,reduce一边转载 2018-02-06 23:34:44 · 1009 阅读 · 0 评论 -
记录一次定位spark shuffle总是报connection reset by peer的问题
问题描述:spark使用dynamicAllocation模式,开启external shuffle service,并且yarn上也正常起了spark-shuffle service ,在shuffle过程中,executor总是报connection reset by peer异常,导致拉取shuffle数据失败,任务失败。 尝试了以下措施: 1. spark.shuffle.blockT...原创 2019-01-19 20:34:03 · 5708 阅读 · 0 评论
分享