一、Spark UI解读
Jobs页面可以看到所有Jobs的执行情况,job的数量取决于action算子的数量。
Stages页面列出所有Stage的执行情况。Spark stage切分是按照宽依赖来区分的,因此粒度上要比job更细一些。
Storage页面显示所做的cache persist等操作。
Environment页面里面展示了当前spark所依赖的环境,比如jdk,lib等等
Executors页面显示executor运行情况,这里可以看到执行者申请使用的内存以及shuffle中input和output的内存等数据。
二、分别用local/standalone/yarn模式运行workcount
1.通过Spark UI来查看执行进度:
①Local模式:

②standalone模式


③yarn模式


2.截取执行成功后输出的结果
①local模式

②standalone模式

③yarn-client模式

本文详细解读了Spark UI的各个组件,如Jobs、Stages、Storage等页面的功能,并对比了local、standalone和yarn三种模式下wordcount任务的执行情况及Spark UI展示的差异。
5436

被折叠的 条评论
为什么被折叠?



