Rancher管理k8s集群

黑客知识

已于 2022-04-19 14:33:47 修改

阅读量7.7k

点赞数 6

分类专栏： kubernetes 文章标签： rancher

于 2022-04-06 09:42:56 首次发布

本文链接：https://blog.youkuaiyun.com/zhiboqingyun/article/details/123982145

版权

kubernetes 专栏收录该内容

10 篇文章

订阅专栏

一、Rancher介绍

1.1、Rancher简介

Rancher是一个开源的企业级多集群Kubernetes管理平台，实现了Kubernetes集群在混合云+本地数据中心的集中部署与管理，以确保集群的安全性，加速企业数字化转型。

超过40,000家企业每天使用Rancher快速创新。

官网：Rancher文档 | K8S文档 | Rancher | Rancher文档

1.2、Rancher和k8s的区别

Rancher和k8s都是用来作为容器的调度与编排系统。但是rancher不仅能够管理应用容器，更重要的一点是能够管理k8s集群。Rancher2.x底层基于k8s调度引擎，通过Rancher的封装，用户可以在不熟悉k8s概念的情况下轻松的通过Rancher来部署容器到k8s集群当中。

二、实验环境

K8S集群角色	公网私网	主机名	版本
控制节点	47.110.143.142 172.17.87.5	k8s-master1	v1.20.6
工作节点	47.110.147.8 172.17.87.4	k8s-node1	v1.20.6
rancher	47.110.150.85 172.17.87.6	rancher	v2.5.7

三、Rancher安装及配置

3.0、二进制安装docker

这里使用Docker作为容器引擎，也可以换成别的，例如containerd
下载地址：https://download.docker.com/linux/static/stable/x86_64/docker-19.03.9.tgz
以下在所有节点操作。这里采用二进制安装，用yum安装也一样

1）解压二进制软件包

wget https://download.docker.com/linux/static/stable/x86_64/docker-19.03.9.tgz
tar zxvf docker-19.03.9.tgz
mv docker/* /usr/bin
docker version

2）systemd管理docker

cat > /usr/lib/systemd/system/docker.service << EOF
[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target
 
[Service]
Type=notify
ExecStart=/usr/bin/dockerd
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=infinity
LimitNPROC=infinity
LimitCORE=infinity
TimeoutStartSec=0
Delegate=yes
KillMode=process
Restart=on-failure
StartLimitBurst=3
StartLimitInterval=60s
 
[Install]
WantedBy=multi-user.target
EOF

3）启动并设置开机启动

systemctl daemon-reload
systemctl start docker
systemctl enable docker
systemctl status docker

3.1、安装rancher

[root@k8s-master1 ~]# docker pull rancher/rancher-agent:v2.5.7
[root@rancher ~]# docker pull rancher/rancher:v2.5.7

# 注：unless-stopped，在容器退出时总是重启容器，但是不考虑在Docker守护进程启动时就已经停止了的容器
[root@rancher ~]# docker run -d --restart=unless-stopped -p 80:80 -p 443:443 --privileged --name rancher rancher/rancher:v2.5.7

[root@rancher ~]# docker ps -a|grep rancher
a893cc6d7bc3   rancher/rancher:v2.5.7   "entrypoint.sh"   3 seconds ago   Up 2 seconds   0.0.0.0:80->80/tcp, :::80->80/tcp, 0.0.0.0:443->443/tcp, :::443->443/tcp   rancher

3.2、登录Rancher平台

在浏览器访问rancher的ip地址：由于未使用授信证书，会有报警，忽略即可

设置中文：

先进入Rancher主界面
界面中右下角有一个English 语言选择。
点击 English 语言选择然后拉到最底下,选择简体中文就可以了

四、Rancher管理已存在的k8s集群

选择添加集群，并导入存在的集群

在k8s控制节点k8s-master1上执行上面箭头所指的命令

[root@k8s-master1 ~]# curl --insecure -sfL https://47.110.150.85/v3/import/rdlm6znr4tzfbwxmls4vhw52mvrscjtd4gsb7plwx7s9vtrtcbnzh7_c-74bb6.yaml | kubectl apply -f -
error: no objects passed to apply

# 再执行一次：
[root@k8s-master1 ~]# curl --insecure -sfL https://47.110.150.85/v3/import/rdlm6znr4tzfbwxmls4vhw52mvrscjtd4gsb7plwx7s9vtrtcbnzh7_c-74bb6.yaml | kubectl apply -f -
clusterrole.rbac.authorization.k8s.io/proxy-clusterrole-kubeapiserver created
clusterrolebinding.rbac.authorization.k8s.io/proxy-role-binding-kubernetes-master created
namespace/cattle-system created
serviceaccount/cattle created
clusterrolebinding.rbac.authorization.k8s.io/cattle-admin-binding created
secret/cattle-credentials-6539558 created
clusterrole.rbac.authorization.k8s.io/cattle-admin created
deployment.apps/cattle-cluster-agent created

[root@k8s-master1 ~]# kubectl get ns
NAME              STATUS   AGE
cattle-system     Active   7m4s
default           Active   5d1h
fleet-system      Active   5m34s
kube-node-lease   Active   5d1h
kube-public       Active   5d1h
kube-system       Active   5d1h
[root@k8s-master1 ~]# kubectl get pods -n cattle-system 
NAME                                    READY   STATUS    RESTARTS   AGE
cattle-cluster-agent-6bdf9bfddd-77vtd   1/1     Running   0          6m5s
[root@k8s-master1 ~]# kubectl get pods -n fleet-system 
NAME                           READY   STATUS    RESTARTS   AGE
fleet-agent-55bfc495bd-8xgsd   1/1     Running   0          3m55s

组件不健康问题解决：

# 原因
[root@k8s-master1 ~]# kubectl get cs
Warning: v1 ComponentStatus is deprecated in v1.19+
NAME                 STATUS      MESSAGE                                                                                       ERROR
controller-manager   Unhealthy   Get "http://127.0.0.1:10252/healthz": dial tcp 127.0.0.1:10252: connect: connection refused   
scheduler            Unhealthy   Get "http://127.0.0.1:10251/healthz": dial tcp 127.0.0.1:10251: connect: connection refused   
etcd-0               Healthy     {"health":"true"}

# 修改kube-scheduler的配置文件
[root@k8s-master1 prometheus]# vim /etc/kubernetes/manifests/kube-scheduler.yaml

# 修改如下内容
1）把--bind-address=127.0.0.1变成--bind-address=172.17.87.5 #172.17.87.5是k8s的控制节点k8s-master1的ip
2）把httpGet:字段下的hosts由127.0.0.1变成172.17.87.5（有两处）
3）把—port=0删除

# 重启各个节点的kubelet
[root@k8s-node1 ~]# systemctl restart kubelet
[root@k8s-node2 ~]# systemctl restart kubelet

# 相应的端口已经被物理机监听了
[root@k8s-master1 prometheus]# ss -antulp | grep :10251	
tcp    LISTEN     0      128      :::10251                :::*                   users:(("kube-scheduler",pid=36945,fd=7))

# 修改kube-controller-manager的配置文件
[root@k8s-master1 prometheus]# vim /etc/kubernetes/manifests/kube-controller-manager.yaml

# 修改如下内容
1）把--bind-address=127.0.0.1变成--bind-address=172.17.87.5 #172.17.87.5是k8s的控制节点k8s-master1的ip
2）把httpGet:字段下的hosts由127.0.0.1变成172.17.87.5（有两处）
3）把—port=0删除

# 重启各个节点的kubelet
[root@k8s-node1 ~]# systemctl restart kubelet
[root@k8s-node2 ~]# systemctl restart kubelet

# 查看状态
[root@k8s-master1 prometheus]# kubectl get cs 
Warning: v1 ComponentStatus is deprecated in v1.19+
NAME                 STATUS    MESSAGE             ERROR
scheduler            Healthy   ok                  
controller-manager   Healthy   ok                  
etcd-0               Healthy   {"health":"true"}

[root@k8s-master1 prometheus]# ss -antulp | grep :10252
tcp    LISTEN     0      128      :::10252                :::*                   users:(("kube-controller",pid=41653,fd=7))