数仓项目中azkaban的工作错误总结！

数仓项目azkaban工作错误总结

最新推荐文章于 2025-09-19 10:15:00 发布

原创

最新推荐文章于 2025-09-19 10:15:00 发布 · 1k 阅读

3 ·

CC 4.0 BY-SA版权

一、写成的sql文件提交到azkaban中，进行任务调度：

博客中有对azkaban的学习，可以看一下，这里主要记录一下azkaban的坑

1、调度文件：*.job,这个文件以.job结尾，其中，格式是这样的：

---
config:
  #failure.emails: xx@xx

nodes:
  - name: dm_release_customer_cube_sql_job
    type: command
    config:
      command: sh dm_release_customer_cube.sh

2.脚本文件：以.sh 结尾，注意！！

这个文件要改成unix格式！！！！

否则执行不了。

3、需要将hdfs的配置文件复制到spark的配置文件中：主要有：

4、任务提交执行时产生的错误：

Exception in thread "main" org.apache.spark.SparkException: 
Yarn application has already ended! 
It might have been killed or unable to launch application master.

这个问题的解决办法是：在yarn-site.xml中添加这个配置：