Spark学习之路——5.Spark UI

本文详细解读了Spark UI的各个组件,如Jobs、Stages、Storage等页面的功能,并对比了local、standalone和yarn三种模式下wordcount任务的执行情况及Spark UI展示的差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Spark UI解读

Jobs页面可以看到所有Jobs的执行情况,job的数量取决于action算子的数量。

Stages页面列出所有Stage的执行情况。Spark stage切分是按照宽依赖来区分的,因此粒度上要比job更细一些。

Storage页面显示所做的cache persist等操作。

Environment页面里面展示了当前spark所依赖的环境,比如jdk,lib等等

Executors页面显示executor运行情况,这里可以看到执行者申请使用的内存以及shuffle中input和output的内存等数据。

二、分别用local/standalone/yarn模式运行workcount

1.通过Spark UI来查看执行进度:

①Local模式:

②standalone模式

③yarn模式

2.截取执行成功后输出的结果

①local模式

②standalone模式

③yarn-client模式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值