节点异常关键字排障
当使用 TKE 集群服务的节点检查能力时,可能会检查出节点异常,包含建议您进一步排查的关键字,本文档总结了节点检查中出现的关键字、异常现象及对应的检查方式(通过正则表达式匹配内核 / dev / dmesg 日志进行检查),您可以根据本文档登录节点进一步排查异常原因。
节点异常关键字含义及检测方式
| 关键字 |
含义 |
匹配用的正则表达式 |
| OOMKilling |
进程 OOM killing |
Killed process \d+ (.+) total-vm:\d+kB, anon-rss:\d+kB, file-rss:\d+kB.* |
| TaskHung |
进程长时间冻结(IO、NFS 等问题) |
task [\S ]+:\w+ blocked for more than \w+ seconds\. |
| UnregisterNetDevice |
网络设备泄露,如存在没有注册的网络设备 |
unregister_netdevice: waiting for \w+ to become free. Usage count = \d+ |
| KernelOops |
内核出现空指针 |
BUG: unable |

最低0.47元/天 解锁文章
1068

被折叠的 条评论
为什么被折叠?



