1、每个算子的subtask,都独立是taskmanager上的一个task
2、one-two-one算子,并行度相同的算子的子任务会串起来形成一个新的subtask,即task
3、同一个job上的task共享slot
4、每个并行实例对应一个task,每个task是一个线程
5、每个slot上的任务都是尽量均匀的,所以,job所需要的slot的个数=最大算子的并行度
6、.slotSharingGroup("group1")使用共享组之后,job所需要的slot的个数=每个共享组最大并行度的和
问题:
1、断开任务链影响什么?
任务链的好处:避免数据跨节点传输,减少线程切换
答:该算子的每个subtask有自己独立的task,整个job算子的最大并行度不变slot个数不变