Flink中并行度和slot的关系——任务和任务槽

原创

于 2024-12-25 19:46:17 发布 · 1.5k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#flink #大数据

一、任务槽（task slots)

Flink的每一个TaskManager是一个JVM进程，在其上可以运行多个线程（任务task），那么每个线程可以拥有多少进程资源呢？任务槽就是这样一个概念，对taskManager上每个任务运行所占用的资源做出明确的划分，即每个任务槽就表示了TaskManager拥有计算资源的一个固定大小的子集。

二、任务槽数量的设置

一个slot独享taskManager意味着更高的隔离级别，任务彼此之间影响降低；多个slot则能共享TCP连接、心跳信息、数据集等，减少了每个任务的运行开销，在降低隔离级别时提高了性能。

可以通过taskmanager.numberOfTaskSlots参数来设置slot数量，最好设置为Cpu核数，因为slot仅仅用来隔离内存，避免不同任务对cpu的竞争。

三、共享slot

对于不同任务节点的子任务，Flink允许它们共享slot。即每个任务节点的子任务一字排开，占据不同的slot， 不同任务节点的子任务可以共享slot。

那么为什么要共享slot呢？引文不同任务节点所需资源是不同的，有些是资源密集型，有些是资源非密集型。设想这样一种情况：在不共享时，有三个任务节点：source/map（这里由于并行度一致，所以合并算子链了）、widdow、sink，其中window是资源密集型的，那么当大量数据到来时，source/map和sink都可以很快完成，但window任务耗时很久，于是下游的sink任务所占据的slot就会因为等待而闲置，而上游的source/map任务也会因为数据积压而产生背压</