- 博客(1)
- 收藏
- 关注
原创 我的Spark调优心得:从课程项目到实战踩坑经验分享
欢迎在评论区交流你的调优故事~- **executor-memory**:根据数据量设置(推荐4-8g),避免频繁GC。- **executor-cores**:建议3-4核(并行执行task能力)- **mapPartitions**:替代低效的map+外部连接。- **foreachPartition**:数据库写入时批量操作。- **num-executors**:集群资源允许时适当增加。4. **源码学习**:推荐《Spark内核设计的艺术》- **过滤法**:直接剔除异常数据(需业务允许)
2025-03-09 00:45:46
385
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅