【yarn】任务日志丢失问题分析

最新推荐文章于 2025-08-18 14:27:50 发布

原创

最新推荐文章于 2025-08-18 14:27:50 发布 · 2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#大数据 #hadoop #yarn

当一个实时任务在YARN上运行时挂掉，发现任务日志消失。通过检查任务结束时间、节点日志，发现日志丢失可能由于找不到用户导致。经过官方文档查询及社区讨论，推测可能是运维操作影响了用户名，从而导致容器启动失败和日志丢失。通过此问题分析，增加了故障排查经验。

【yarn】任务日志丢失问题分析

故事背景

今天中午收到了一个报警邮件通知。内容大致为：有一个正在 yarn上运行的flink的实时任务挂掉了。
针对上述的现象，我们的开发工程师先打开yarn的web ui找到对应的job的任务页面。查询任务日志。
在这里插入图片描述
点击这个log，找不到任何日志。那么很显然，这个任务的container已经没了，日志已经找不到了。
引出问题：日志怎么会消失？

探究过程

通过上图的Finished这一栏可以看到，这个任务在什么时候结束运行的，从上图得知，这个任务是在Wed Nov 16 12:58:09 +0800 2022挂掉的。
记录最下面Node栏对应的机器ip（在上面的图片中我打码了，这个机器是yarn的一个node节点，请根据自己的环境来分析）
在做好上述两点的基础上，先找到这台Node节点，然后检查该节点的NodeManager的日志，目前我用的环境是cdh,所以我可以在cloudera manager管理界面上查看到对应的NodeManager的角色日志，找到Finshed时间对应的日志，日志如下：

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。