Kubernetes 在部署 metrics-server 的时候报错

开始解决下面这个报错信息前,我们需要知道为什么需要部署 metrics-server 服务?该服务是用来做什么的?
kubernetes 1.18.20 集群上部署 Metrics-Server 的时候出现了如下的错误:

E1120 04:38:00.531458       1 scraper.go:139] "Failed to scrape node" err="Get \"https://110.128.134.114:10250/stats/summary?only_cpu_and_memory=true\": x509: cannot validate certificate for 110.128.34.114 because it doesn't contain any IP SANs" node="www.datang001.com"
E1120 04:38:00.561295       1 scraper.go:139] "Failed to scrape node" err="Get \"https://110.128.134.116:10250/stats/summary?only_cpu_and_memory=true\": x509: cannot validate certificate for 110.128.34.116 because it doesn't contain any IP SANs" node="www.datang002.com"
E1120 04:38:00.567535       1 scraper.go:139] "Failed to scrape node" err="Get \"https://110.128.134.115:10250/stats/summary?only_cpu_and_memory=true\": x509: cannot validate certificate for 110.128.34.115 because it doesn't contain any IP SANs" node="www.datang003.com"
E1120 04:38:00.580040       1 scraper.go:139] "Failed to scrape node" err="Get \"https://110.147.207.181:10250/stats/summary?only_cpu_and_memory=true\": x509: cannot validate certificate for 110.147.207.181 because it doesn't contain any IP SANs" node="www.datang004.com"
I1120 04:38:04.324529       1 server.go:188] "Failed probe" probe="metric-storage-ready" err="not metrics to serve"

根据我的 kubernetes 的版本,我选择的是 Metrics-Serverv0.5.2 版本,之所以出现上述的报错信息,是因为 kubelet 的10250端口使用的是 https 协议,连接需要验 tls 的客户端证书,我们应该在配置文件 components.yaml 添加 - --kubelet-insecure-tls参数后,就不需要验证客户端证书了。

...
...
spec:
      containers:
      - args:
        - --cert-dir=/tmp
        - --secure-port=4443
        - --kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname
        - --kubelet-use-node-status-port
        - --metric-resolution=15s
        - --kubelet-insecure-tls
        image: k8s.gcr.io/metrics-server/metrics-server:v0.5.2
        imagePullPolicy: IfNotPresent
        livenessProbe:
          failureThreshold: 3
...
...

修改之后,再次查看各个 node 节点的 cpumemory 使用情况:

[shutang@www.datang001.com metrics-server]$ kubectl top node
NAME              CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%
www.datang001.com   946m         23%    8569Mi          54%
www.datang002.com   645m         16%    10149Mi         64%
www.datang003.com   627m         15%    12534Mi         79%
www.datang004.com   902m         5%     17756Mi         13%
www.datang005.com   2066m        8%     57763Mi         44%
www.datang006.com   513m         2%     14375Mi         11%

查看单个 Pod 的使用情况:

[shutang@www.datang001.com metrics-server]$ kubectl top pod  kube-proxy-sgwfh -n kube-system
NAME               CPU(cores)   MEMORY(bytes)
kube-proxy-sgwfh   1m           22Mi
<think>好的,用户想在Kubernetes集群上安装和配置Metrics Server来监控资源使用情况。我需要根据提供的引用资料整理出步骤。首先,检查Kubernetes版本,确保兼容性,因为不同版本的Metrics Server对应不同的Kubernetes版本。比如,0.5.x需要K8s 1.8+,用户需要确认集群版本是否符合。 接下来是下载和安装。引用2提到可以直接使用kubectl apply在线安装0.5.0版本,对应的YAML文件地址是给定的GitHub链接。但用户可能会遇到镜像拉取问题,尤其是国内环境,可能需要修改镜像地址为国内源,比如将k8s.gcr.io的镜像替换成registry.cn-hangzhou.aliyuncs.com/google_containers。 然后是配置部分,可能需要修改YAML文件中的参数,比如添加--kubelet-insecure-tls参数,绕过证书验证,特别是在使用自签名证书的环境里。引用3提到安装后测试时出现“metrics not available yet”,这可能是因为Metrics Server还没有收集到数据,需要等待一段时间,或者检查配置是否正确。 另外,用户可能需要关闭代理,如引用3提到的,或者检查网络策略是否允许Metrics Server与节点通信。安装完成后,通过kubectl top nodes和kubectl top pods命令验证是否成功。 还要注意,如果安装后仍然报错,可以查看Metrics Server的日志,使用kubectl logs命令来排查问题,比如证书错误或网络连接问题。最后,确保Metrics API已经注册,可以使用kubectl get apiservices检查。 需要把这些步骤整理成清晰的教程,分步骤说明,同时提醒用户常见的错误和解决方法。可能还需要生成相关问题,比如版本兼容性、故障排除等,帮助用户进一步理解。</think>### Kubernetes集群安装Metrics Server教程 #### 一、版本兼容性检查 Metrics Server版本需与Kubernetes版本匹配: - $0.5.x$ 支持 Kubernetes $1.8+$ - $0.6.x$ 需要 Kubernetes $1.19+$[^1] 可通过命令验证集群版本: ```bash kubectl version --short ``` #### 二、安装部署步骤 1. **直接在线安装(推荐)** 执行以下命令安装v0.5.0版本: ```bash kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.5.0/components.yaml ``` 此方式会创建`metrics-server`命名空间及相关资源[^2]。 2. **离线安装(镜像加速)** 若遇到镜像拉取失败,修改YAML文件中的镜像地址: ```yaml spec: containers: - name: metrics-server image: registry.cn-hangzhou.aliyuncs.com/google_containers/metrics-server:v0.5.0 ``` 然后手动应用修改后的文件: ```bash kubectl apply -f components.yaml ``` #### 三、关键配置调整 在部署文件中添加以下参数确保正常通信: ```yaml args: - --kubelet-insecure-tls # 忽略证书验证 - --kubelet-preferred-address-types=InternalIP # 优先使用内网IP ``` #### 四、验证安装结果 1. 检查Pod状态: ```bash kubectl get pods -n kube-system | grep metrics-server ``` 正常状态应为`Running` 2. 测试资源监控(需等待1-2分钟数据采集): ```bash kubectl top nodes # 节点资源监控 kubectl top pods # Pod资源监控 ``` 若出现`error: metrics not available yet`,检查网络策略或等待数据同步[^3] #### 五、故障排查 1. **查看日志**: ```bash kubectl logs -n kube-system metrics-server-xxxxxx ``` 2. **检查API服务状态**: ```bash kubectl get apiservices | grep metrics ``` 正常应返回`Available`状态 #### 六、典型问题解决 - **镜像拉取失败**:手动替换为国内镜像源 - **证书验证失败**:添加`--kubelet-insecure-tls`参数 - **网络不通**:检查Calico/Flannel网络插件状态
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

觅食的蛇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值