《基于 Apache Flink 的流处理》阅读笔记(三)

本文详细介绍了Apache Flink的运行时架构,包括JobManager、TaskManager、ResourceManager和Dispatcher的角色与职责。讨论了并行度设置、任务执行、故障处理、数据通信以及Flink中的时间语义,如时间戳和水位线的概念。通过理解这些概念,有助于深入掌握Flink的流处理机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《基于 Apache Flink 的流处理》阅读笔记(二)

Apache Flink架构

  • 运行时架构:四个JVM进程运行在不同的物理节点上

    • JobManager:

      • 主进程控制单个应用程序执行,每个应用程序都有一个JobManager进行控制
      • 包括:JobGraph(Dataflow图,执行时转化为物理Dataflow图)+ 类库资源的 JAR 包
      • 根据物理 Dataflow 图(ExecutionGraph)向 ResourceManager 申请资源(就是槽 slots),然后分发运行
      • 运行中协调操作,协调 checkpoint,协调恢复,至少要有一个 JobManager
    • TaskManager

      • 工作进程;包含多个线程——slots 作为资源进行分配

      • slots 向 ResourceManager 注册,JobManager申请就能够分配

      • slots 对应着运行并行度

        设置taskslot的时候推荐的就是设置为CPU的核数(虽然隔离的是内存,共享的是CPU,这样安排是因为避免各个slot之间共享CPU导致的CPU繁忙)
        并行度parallelsim和slots的关系是动态和静态的关系:也就是说,例如三个taskmanager(一个taskm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值