spark运行流程

天选之子123

于 2025-01-26 10:55:16 发布

阅读量879

点赞数 2

分类专栏：大数据文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_51192710/article/details/145366614

版权

大数据专栏收录该内容

15 篇文章

订阅专栏

spark运行流程

在这里插入图片描述

任务提交后，先启动 Driver 程序
随后 Driver 向集群管理器注册应用程序
集群管理器根据此任务的配置文件分配 Executor 并启动
Driver 开始执行 main 函数，Spark 查询为懒执行，当执行到 Action 算子时开始反向推
算，根据宽依赖进行 Stage 的划分，随后每一个 Stage 对应一个 Taskset，Taskset 中有多个 Task
查找可用资源 Executor 进行调度
根据本地化原则，Task 会被分发到指定的 Executor 去执行
任务执行的过程中，Executor 也会不断与 Driver 进行通信，报告任务运行情况
进行通信，报告任务运行情况

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。