
1.shuffle的发展历程

1.5以前的版本是HashShuffleManager,然后1.6版本是优化后的HashShuffleManager,然后2.0版本以后都是SortShuffleManager,而SortShuffleManager有两个运行机制,第一个是普通运行机制,第二个是bypass运行机制。
2 1.2版本以前 HashShuffleManager

1. 上游的Task任务的输出会先写到buffer缓存中
2. 如果数据较多,会溢写到文件中(磁盘)
3. 每个task要写多少个标号