问题排查:

分别查看pod日志:prometheus-k8s-0以及prometheus-operator-78bd98fc99-bmkbq
经查:prometheus-k8s-0日志显示 err=“log series: open /prometheus/wal: no such file or directory”
k logs prometheus-k8s-0 -n monitoring -c prometheus -f

查看 journalctl -f -u kubelet 日志报错:remove xxx : device or resource busy

分析有可能是由于数据损坏导致pod不能对数据目录进行更改操作导致。
尝试解决办法:
1、直接手动删除或者移除数据目录
2、查找数据目录进程,杀掉进程后,手动移除数据目录
办法一解决步骤:
找到数据目录,查看数据目录下是否存在数据:
#此路径为公司内部环境还原客户环境测试过程中产生
ll /data/381/k8s/lib/kubelet/pods/d8a23fa5-98ea-11ea-b346-52540018083f_bak02/volume-subpaths/p

本文详细记录了一次Prometheus监控系统中出现的nosuchfileordirectory错误的排查与解决过程,涉及pod日志分析、数据目录处理、磁盘挂载目录问题及k8s组件重启步骤。
最低0.47元/天 解锁文章
367

被折叠的 条评论
为什么被折叠?



