根据yahoo架构师Milind Bhandarkar在《Hadoop Application Performance Tuning》中的阐述,
Hadoop的性能调优主要分为以下六个方面:
• Changing number of Map and Reduce tasks
• Decrease Intermediate data size using combiner
• Decrease map-side disk spill
• Decrease intermediate data size by compressing map output
• Decrease Reduce-side disk spill
• Increase Slots per node
Author:谢
本文介绍了Hadoop性能调优的关键方面,包括调整Map和Reduce任务数量、减少中间数据大小、压缩Map输出等六个核心策略。
727

被折叠的 条评论
为什么被折叠?



