Error: invalid log directory /app/spark/...

最新推荐文章于 2022-08-19 11:42:48 发布

原创最新推荐文章于 2022-08-19 11:42:48 发布 · 776 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spark

大数据同时被 3 个专栏收录

14 篇文章

订阅专栏

Bug

10 篇文章

订阅专栏

spark

3 篇文章

订阅专栏

在独立部署的Spark环境中，如果以cluster模式提交应用，并且在spark-env.sh中配置了worker日志清理选项（如：SPARK_WORKER_OPTS='-Dspark.worker.cleanup.enabled=true -Dspark.worker.cleanup.interval=1800 -Dspark.worker.cleanup.appDataTtl=60'），可能会导致worker定期清理已完成的driver和application的日志。这将使得stdout和stderr日志消失。解决方案是适当调整清理周期，避免过早删除重要日志。

问题背景：

在以stanalone方式部署的spark环境中，以cluster方式提交application后，过了半天发现在web页面driver上stdout和stderr上的日志全部都没有了，stdout中显示error: invalid log director /app/spark/...

问题原因：

由于在spark-env.sh中配置了每个worker清理日志的时间，即SPARK_WORKER_OPTS='-Dspark.worker.cleanup.enabled=true -Dspark.worker.cleanup.interval=1800 -Dspark.worker.cleanup.appDataTtl=60'，
上述3个参数的含义为：
spark.worker.cleanup.enabled：是否开启自动清理
spark.worker.cleanup.interval：清理worker上old application周期，每隔多长时间清理一次，单位为秒
spark.worker.cleanup.appDataTtl：保留最近多长时间的数据

由于设置了worker自动清理日志的时间，导致定时将worker下面的Completed Drivers和Completed Applications中的日志都删除了。

解决方法：

考虑磁盘空间，合理的将清理周期设置大一点