Kubernetes 应用、安全与网络故障排查指南
1. 应用故障排查
在使用 Kubernetes 集群时,除了集群组件可能出现问题外,应用故障也较为常见。下面将介绍如何对部署在 Kubernetes 集群上的容器化应用进行故障排查。
1.1 获取全局视图
要排查应用故障,首先需要获取全局视图。可以使用以下命令一次性获取所有信息:
kubectl get pods --all-namespaces
也可以使用简写形式:
kubectl get pods -A
输出结果会显示每个命名空间中正在运行的 Pod,从中可以轻松找出失败的 Pod。查看输出信息时,重点关注 NAMESPACE 、 READY 和 STATUS 列,它们能告诉你哪些命名空间中的 Pod 正在运行以及运行的副本数量。如果确定了某个命名空间中特定 Pod 的故障,就可以进入下一步检查命名空间事件。
1.2 检查命名空间事件
使用以下命令可以查看默认命名空间中部署的应用发生了什么:
kubectl get events
输出结果中的一些关键列如下:
- TYPE 列显示事件类型,可能是
超级会员免费看
订阅专栏 解锁全文
327

被折叠的 条评论
为什么被折叠?



