UI页面
- 一般是集群ip:4040进入ui页面
- 主要是:Job,Stage,Storage,Environment,Executor
- spark任务由一系列算子组成Stage,不同Stage组成Job,分发给不同Executor执行。主要看这3个页面观察任务执行情况
Job

- 查看整个任务执行时间线,比如Driver和Executor各自启动的时间
- 查看Jobs执行情况,观察是否有几个Job一直卡着没执行,是否有问题

3. 特别是在这种很多executor场景下,观察是否只有少部分executor在运行任务

4. 每个job都有指明代码文件xxx.py以及对应的行数,可以及时定位
Stages
可以从Job页面点击对应的Stage跳转过来,查看Stage的执行情况

- 查看stage组成情况,

最低0.47元/天 解锁文章
447

被折叠的 条评论
为什么被折叠?



