Spark中Standalone的两种提交模式(Standalone-client模式与Standalone-cluster模式)
一.Standalone-client提交任务方式
执行流程
1.client模式提交任务后,会在客户端启动Driver进程。
2.Driver会向Master申请启动Application启动的资源。
3.资源申请成功,Driver端将task发送到worker端执行。
4.worker将task执行结果返回到Driver端。
总结
- 1.client模式适用于测试调试程序。Driver进程是在客户端启动的,这里的客户端就是指提交应用程序的当前节点。在Driver端可以看到task执行的情况。生产环境下不能使用client模式,是因为:假设要提交100个application到集群运行,Driver每次都会在client端启动,那么就会导致客户端100次网卡流量暴增的问题。(因为要监控task的运行情况,会占用很多端口,如上图的结果图)客户端网卡通信,都被task监控信息占用。
2.Client端作用
Driver负责应用程序资源的申请
任务的分发。
结果的回收。
监控task执行情况。
二 .Standalone-cluster提交任务方式
执行流程图:

执行流程
- 1.cluster模式提交应用程序后,会向Master请求启动Driver.(而不是启动application)
- 2.Master接受请求,随机在集群一台节点启动Driver进程。
- 3.Dri

本文详细介绍了Spark中Standalone的两种提交模式——Standalone-client和Standalone-cluster模式。在client模式下,Driver在客户端启动,适合测试调试,但不适用于生产环境,因为它可能导致客户端网卡流量激增。而在cluster模式中,Driver在集群内随机节点启动,能有效分散流量,适用于生产环境。
最低0.47元/天 解锁文章
516

被折叠的 条评论
为什么被折叠?



