【 Kubernetes 集群】节点常见报错与处理

节点异常关键字排障

当使用 TKE 集群服务的节点检查能力时,可能会检查出节点异常,包含建议您进一步排查的关键字,本文档总结了节点检查中出现的关键字、异常现象及对应的检查方式(通过正则表达式匹配内核 / dev / dmesg 日志进行检查),您可以根据本文档登录节点进一步排查异常原因。

节点异常关键字含义及检测方式

关键字

含义

匹配用的正则表达式

OOMKilling

进程 OOM killing

Killed process \d+ (.+) total-vm:\d+kB, anon-rss:\d+kB, file-rss:\d+kB.*

TaskHung

进程长时间冻结(IO、NFS 等问题)

task [\S ]+:\w+ blocked for more than \w+ seconds\.

UnregisterNetDevice

网络设备泄露,如存在没有注册的网络设备

unregister_netdevice: waiting for \w+ to become free. Usage count = \d+

KernelOops

内核出现空指针

BUG: unable

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值