节点异常检测 node-problem-detector

最新推荐文章于 2024-11-19 15:01:21 发布

柠是柠檬的檬

最新推荐文章于 2024-11-19 15:01:21 发布

阅读量2.4k

点赞数

分类专栏： k8s 文章标签： kubernetes docker 运维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43616190/article/details/126415683

版权

背景

当 Kubernetes 中节点发生如下问题时，在整个集群中，K8S 服务组件并不会感知这些问题，就会导致 Pod 仍会调度至问题节点。所以就需要一个检测机制来检测上述问题。

基础服务问题：NTP 服务挂了；
硬件问题：CPU，内存或磁盘损坏；
内核问题：内核死锁，文件系统损坏；
容器运行时问题：运行时守护程序无响应。

node-problem-detector

https://github.com/kubernetes/node-problem-detector
node-problem-detector是集群节点的健康监测组件。以 DaemonSet 方式运行，帮助用户实时检测节点上的各种异常情况，并将检测结果报告给上游的 Kube-apiserver。

故障种类

file

故障上报

node-problem-detector 通过设置 NodeCondition 或者创建 Event 对象来汇报问题。

Nodecondition：针对永久性故障，会通过设置NodeCondition 来改变节点状态。
Event：临时故障通过 Event 来提醒相关对象，比如通知当前节点运行的所有 Pod。

自定义npd插件

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

柠是柠檬的檬 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。