Spark程序执行逻辑迷你版

最新推荐文章于 2025-05-28 17:37:56 发布

{BOOLEAN}

最新推荐文章于 2025-05-28 17:37:56 发布

阅读量569

点赞数

分类专栏： Spark 文章标签： spark 大数据 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_70131998/article/details/127342466

版权

Spark 专栏收录该内容

1 篇文章

订阅专栏

Driver就是自己写的程序，里面有一个main方法，main方法划分DAG，形成Task，再把Task发出去
DAGScheduler的功能，将rdd转换逻辑切分stage，生成taskset

然后模拟taskScheduler的功能，将这些task发到Executor上去执行（真正的发送逻辑spark submit
进程启动Driver，然后Driver会找Executor，将Executor启动起来，然后Executor会向Driver反向注册
是动态获取的，这样Driver会持有Executor的地址，Executor知道Driver在哪里，Driver也知道Executor在哪里）

注意，如果划分有两个stage，是会有两个taskset的

然后在虚拟机上，上传打好的jar包，这样就会看到三个节点有三个Executor启动，然后用submit进程启动，里面调用Driver
发布任务到Executor，然后三个Executor就会执行对应自己分区的任务

博客等级

码龄3年

35
原创

161
点赞

140
收藏

119
粉丝

关注

私信

热门文章

分类专栏

Spark 1篇

展开全部收起

下一篇：: Hive字符串转日期细节

最新评论

使用Python元组的小技巧
优快云-Ada助手: 恭喜您写了第5篇博客，标题为“使用Python元组的小技巧”！您的文章内容深入浅出，让人受益匪浅。希望您能继续分享更多关于Python编程的技巧与经验，或许可以考虑写一些实用的代码案例，让读者能更直观地理解和应用。期待您的下一篇作品！
spark-flink设计思想之吸星大法-1
JJJ69: 写得不错，对我有帮助
使用array_intersect在Spark中处理数组数据
优快云-Ada助手: 恭喜您写了这篇关于在Spark中处理数组数据的博客！您对于使用array_intersect的介绍很详细，让我受益良多。希望您能继续分享关于Spark的知识，也希望能看到您对于其他数组操作的介绍，比如array_union或者array_contains等等。期待您更多的创作！
二叉树在机器学习中的应用
优快云-Ada助手: 恭喜您写了第15篇博客！标题“二叉树在机器学习中的应用”非常吸引人。您在这篇博客中准确地指出了二叉树在机器学习中的应用，这对我们学习机器学习的人来说会有很大的帮助。下一步，我建议您可以进一步探索不同类型的树结构在机器学习中的应用，比如决策树、随机森林等等。非常期待您在后续的创作中分享更多有关树结构在机器学习方面的应用案例和技巧。再次恭喜您，期待您的下一篇博客！
spark生产问题之一：执行作业报错 “org.apache.spark.sql.AnalysisException: undefined function: ‘your_function‘ is~~
优快云-Ada助手: 恭喜作者第14篇博客的发布！看到你对spark生产问题的深入探讨，让我受益匪浅。关于这个报错问题，我想提醒一下，可能是由于函数名称拼写错误或者函数未注册导致的。希望你在下一篇博客中可以分享一些解决这类问题的实用技巧，期待你的下一篇作品！加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

{BOOLEAN} 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。