Keepalive

原创已于 2024-03-18 13:05:23 修改 · 1.1k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#服务器 #运维 #linux #网络

于 2024-03-07 13:12:03 首次发布

本文围绕Keepalived展开，介绍了VRRP技术、Keepalived的架构、安装及配置等内容。阐述了VRRP的工作方式、安全认证和工作模式，分析了Keepalived的组件功能。还探讨了脑裂问题的成因与解决办法，最后讲解了Keepalived利用VRRP Script解决Nginx高可用的方法。

2.4.3.1模式实验（依托于大实验成功后）

4.Keepalived解决Nginx的高可用

4.1VRRP Script配置

4.2定义VRRP Scripts

1.Keepalive基础

1.1 vrrp技术

VRRP相关术语

- 虚拟路由器：Virtual Router 不是真实存在，虚构出来的
- 虚拟路由器标识：VRID(0-255)，唯一标识虚拟路由器
- VIP：Virtual IP 192.168.91.100 路由1 路由2
- VMAC：Virutal MAC (00-00-5e-00-01-VRID)
- 物理路由器：
- master：主设备
- backup：备用设备
- priority：优先级

网络vrrp那章已详细说明，
状态机心跳线： 1s
虚拟路由器的主备是由priority：优先级决定的

1.2VRRP相关技术

通告：心跳，优先级等；周期性

工作方式：抢占式，非抢占式，延迟抢占模式

安全认证：

- 无认证
- 简单字符认证：预共享密钥
- MD5

工作模式：

- 主/备：单虚拟路径器
- 主/主：主/备（虚拟路由器1），备/主（虚拟路由器2）

#通告：
是宣告自己的主权，不要妄想抢班夺权，不停的向外

#抢占式：
主服务器宕机，过了一段时间修好了，再把主权抢过来

#非抢占式：
主服务器宕机，过了一段时间修好了，原来的主就作为备了

#延迟抢占：
主修好后，等待一定的时间（300s）后再次成为主

#抢占式好还是非抢占式好？

#安全认证：
如没有安全认证，不在集群中的keeplive服务器设置超高的优先级，会造成事故

#主/主：主/备（虚拟路由器1），备/主（虚拟路由器2）见下图：
环境：
有两台服务器
虚拟出两台虚拟路由器
第一台虚拟路由器中服务器1为主，服务器2为备，那么虚拟IP1就飘在服务器1上，真正工作的只有服务器1
第二台虚拟路由器中服务器2为主，服务器1为备，那么虚拟IP2就飘在服务器2上，真正工作的只有服务器2
优点：
#提高了资源利用率：
这样主，备服务器同时干活，可以同时运行两个项目
#同样有备份功能：
如果服务器1坏了，服务器2 将同时拥有虚拟IP1和虚拟IP2

缺点：
虽然有备份冗余功能但是对机器的性能要求非常高，当其中一台出现故障，本来一台运行一个任务，现在所有的业务全部压在了一台上，有十分大的风险

2.1Keepalived介绍

官网：http://keepalived.org/

lvs 调度虚拟ip 手动配置

keepalived 会lvs
lvs

ipvsadm

功能：

- 基于vrrp协议完成地址流动
- 为vip地址所在的节点生成ipvs规则(在配置文件中预先定义)
- 为ipvs集群的各RS做健康状态检测
- 基于脚本调用接口完成脚本中定义的功能，进而影响集群事务，以此支持nginx、haproxy等服务

2.2Keepalived架构

官方文档：

https://keepalived.org/doc/
http://keepalived.org/documentation.html

用户空间核心组件：

1. vrrp stack：VIP消息通告虚拟ip

2. checkers：监测real server（简单来说就是监控后端真实服务器的服务）是否存活

3. system call：实现 vrrp 协议状态转换时调用脚本的功能

4. SMTP：邮件组件（报警邮件）

5. IPVS wrapper：生成IPVS规则（直接生成ipvsadm）

6. Netlink Reflector：网络接口（将虚拟地址ip（vip）地址飘动）
WatchDog：监控进程（整个架构是否有问题）

控制组件：提供keepalived.conf 的解析器，完成Keepalived配置
IO复用器：针对网络目的而优化的自己的线程抽象
内存管理组件：为某些通用的内存管理功能（例如分配，重新分配，发布等）提供访问权限

keeplive可以配合ngnix等软件，反向代理

2.3安装Keepalive

yum  install  keepalived  -y

2.4Keepalived相关文件

- 软件包名：keepalived
- 主程序文件：/usr/sbin/keepalived
- 主配置文件：/etc/keepalived/keepalived.conf
- 配置文件示例：/usr/share/doc/keepalived/
- Unit File：/lib/systemd/system/keepalived.service
- Unit File的环境配置文件：
- /etc/sysconfig/keepalived CentOS

2.4.1配置组成

/etc/keepalived/keepalived.conf 配置组成

- GLOBAL CONFIGURATION

Global definitions（全局配置）：定义邮件配置，route_id，vrrp配置，组播地址等

- VRRP CONFIGURATION

VRRP instance(s)：定义vrrp协议中的每个vrrp虚拟路由器的规则，基本信息

- LVS CONFIGURATION（lvs调度服务器的规则设置）

Virtual server group(s)

Virtual server(s)：LVS集群的VS和RS

2.4.2全局配置

#/etc/keepalived/keepalived.conf
global_defs {
notification_email {
root@localhost
#keepalived 发生故障切换时邮件发送的目标邮箱，可以按行区分写多个
root@localhost
  360601212@qq.com
}

notification_email_from keepalived@localhost
#发邮件的地址
smtp_server 127.0.0.1
#邮件服务器地址
smtp_connect_timeout 30
#邮件服务器连接timeout
router_id R1
#每个keepalived主机唯一标识，建议使用当前主机名，但多节点重名不影响
vrrp_skip_check_adv_addr

#对所有通告报文都检查，会比较消耗性能，启用此配置后，如果收到的通告报文和上一个报文是同一个路由器，则跳过检查，默认值为全检查
vrrp_strict
#严格遵守VRRP协议,启用此项后以下状况将无法启动服务:1.无VIP地址 2.配置了单播邻居 3.在VRRP版本2中有IPv6地址，开启动此项并且没有配置vrrp_iptables时会自动开启iptables防火墙规则，默认导致VIP无法访问,建议不加此项配置。

vrrp_garp_interval 0
#gratuitous ARP messages 免费ARP报文发送延迟，0表示不延迟
vrrp_gna_interval 0
#unsolicited NA messages （不请自来）消息发送延迟
vrrp_mcast_group4 224.0.0.18
#指定组播IP地址范围：224.0.0.0到239.255.255.255,默认值：224.0.0.18
vrrp_iptables
#此项和vrrp_strict同时开启时，则不会添加防火墙规则,如果无配置vrrp_strict项,则无需启用此项配置
}

地址分类：

自定义组播，一般都有规划，不能瞎配
主和备要一样
A类：1-126
B 128-191
C 192-223
D 224-239
E 240-

#修改组播
默认keepalived主机之间利用多播相互通告消息，会造成网络拥塞，可以替换成单播，减少网络流量
注意：启用 vrrp_strict 时，不能启用单播
#在所有节点vrrp_instance语句块中设置对方主机的IP，建议设置为专用于对应心跳线网络的地址，而非使用业务网络

2.4.3配置虚拟路由器

vrrp_instance <STRING> {
#<String>为vrrp的实例名,一般为业务名称
配置参数
......
}
#配置参数：
state MASTER|BACKUP
#当前节点在此虚拟路由器上的初始状态，状态为MASTER或者BACKUP
interface IFACE_NAME
#绑定为当前虚拟路由器使用的物理接口，如：eth0,bond0,br0,可以和VIP不在一个网卡
virtual_router_id VRID
#每个虚拟路由器惟一标识，范围：0-255，每个虚拟路由器此值必须唯一，否则服务无法启动，同属一个虚拟路由器的多个keepalived节点必须相同,务必要确认在同一网络中此值必须唯一
priority 100
#当前物理节点在此虚拟路由器的优先级，范围：1-254，值越大优先级越高,每个keepalived主机节点此值不同

advert_int 1
#vrrp通告的时间间隔，默认1s

authentication {
#认证机制
auth_type AH|PASS
#AH为IPSEC认证(不推荐),PASS为简单密码(建议使用)
auth_pass <PASSWORD>
#预共享密钥，仅前8位有效，同一个虚拟路由器的多个keepalived节点必须一样
}
include /etc/keealived/conf.d/*.conf
virtual_ipaddress {
#虚拟IP,生产环境可能指定上百个IP地址
<IPADDR>/<MASK> brd <IPADDR> dev <STRING> scope <SCOPE> label <LABEL>
192.168.200.100
#指定VIP，不指定网卡，默认为,注意：不指定/prefix,默认为/32
192.168.200.101/24 dev eth1
#指定VIP的网卡，建议和interface指令指定的岗卡不在一个网卡
192.168.200.102/24 dev eth2 label eth2:1
#指定VIP的网卡label
}
track_interface {
#配置监控网络接口，一旦出现故障，则转为FAULT状态实现地址转移
eth0
eth1
…
}

2.4.3.1模式实验（依托于大实验成功后）

抢占模式，非抢占模式，延迟抢占模式

[root@localhost keepalived]#tcpdump -i ens33 -nn host 224.0.0.18
#启动服务可以抓包查看
[root@localhost ~]#ping 192.168.91.10
#真实服务器ping是可以通的
可以做实验一直抓包

#非抢占模式
默认模式使用的抢占式
主节点会抢占回来，会造成两次网络动荡。
#注意：要关闭 VIP抢占，必须将各 keepalived 服务器state配置为BACKUP
#非抢占式
#1主机配置
vrrp_instance VI_1 {
state BACKUP     #都为BACKUP
interface ens33
virtual_router_id 66
priority 100   #优先级高
advert_int 1
nopreempt         #添加此行，都为nopreempt
#2主机配置
vrrp_instance VI_1 {
state BACKUP         #都为BACKUP
interface ens33
virtual_router_id 66
priority 80       #优先级低
advert_int 1
nopreempt   #添加此行，都为nopreempt

#延迟抢占
preempt_delay #     #指定抢占延迟时间为#s，默认延迟300s
#注意：需要各keepalived服务器state为BACKUP,并且不要启用 vrrp_strict
#1主机配置
vrrp_instance VI_1 {
state BACKUP     #都为BACKUP
interface eth0
virtual_router_id 66

priority 100 #优先级高
advert_int 1
preempt_delay 30 #抢占延迟模式，默认延迟300s

#2主机配置
vrrp_instance VI_1 {
state BACKUP       #都为BACKUP
interface eth0
virtual_router_id 66
priority 80 #优先级低
advert_int 1

priority 80 #优先级高
advert_int 1
preempt_delay 60    #抢占延迟模式，默认延迟300s

2.4.3.2单播多播地址

#两边都要加主从

global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_R1
vrrp_mcast_group4 234.6.6.6
#添加此行
0-127
128-191
192-223

224-239

}
[root@localhost ~]# tcpdump -i ens33 -nn host 234.6.6.6
#抓包查看查看
[root@localhost keepalived]#systemctl stop keepalived.service
#模拟故障，可以正常切换

修改单播：

#在所有节点vrrp_instance语句块中设置对方主机的IP，建议设置为专用于对应心跳线网络的地址，而非
使用业务网络
unicast_src_ip <IPADDR> #指定发送单播的源IP
unicast_peer {
   <IPADDR>     #指定接收单播的对方目标主机IP
   ......
}

#主服务器
vrrp_instance VI_1 {
   state MASRER
   interface eth0
   virtual_router_id 66
   priority 100
   advert_int 1
   authentication {
       auth_type PASS
       auth_pass 123456
   }
   virtual_ipaddress {
        10.0.0.10/24 dev eth0 label eth0:1
   }
   unicast_src_ip 192.168.91.100     #本机IP master 100 backup101
   unicast_peer{
   192.168.91.101 #指向对方主机IP 如果有多个keepalived,再下面加其它节点的IP
   }
}

vrrp_instance VI_2 {
   state BACKUP
   interface eth0
   virtual_router_id 66
   priority 80
   advert_int 1
   authentication {
       auth_type PASS
       auth_pass 123456
   }
   virtual_ipaddress {
        10.0.0.11/24 dev eth0 label eth0:1
   }
   unicast_src_ip 192.168.91.100     #本机IP
   unicast_peer{
   192.168.91.101 #指向对方主机IP 如果有多个keepalived,再下面加其它节点的IP
   }
}

备服务器
vrrp_instance VI_1 {
   state BACKUP
   interface eth0
   virtual_router_id 66
   priority 100
   advert_int 1
   authentication {
       auth_type PASS
       auth_pass 123456
   }
   virtual_ipaddress {
        10.0.0.10/24 dev eth0 label eth0:1
   }
}

vrrp_instance VI_2 {
   state MASTER
   interface eth0
   virtual_router_id 66
   priority 80
   advert_int 1
   authentication {
       auth_type PASS
       auth_pass 123456
   }
   virtual_ipaddress {
        10.0.0.11/24 dev eth0 label eth0:1
   }

}

#复制段
unicast_src_ip 192.168.91.100
   unicast_peer{
192.168.91.101
}

unicast_src_ip 192.168.91.101
   unicast_peer{
192.168.91.100
192.168.91.188

}

[root@localhost ~]#tcpdump -i ens33 host -nn 192.168.91.100
#在从节点抓包验证

2.4.3.3通知脚本

当前节点成为主节点时触发的脚本

notify_master <STRING>|<QUOTED-STRING>

当前节点转为备节点时触发的脚本

notify_backup <STRING>|<QUOTED-STRING>

当前节点转为“失败”状态时触发的脚本

notify_fault <STRING>|<QUOTED-STRING>

通用格式的通知触发机制，一个脚本可完成以上三种状态的转换时的通知

notify <STRING>|<QUOTED-STRING>

当停止VRRP时触发的脚本

notify_stop <STRING>|<QUOTED-STRING>

#配置邮箱
[root@localhost opt]#vim /etc/mail.rc
set from=940132245@qq.com
set smtp=smtp.qq.com
set smtp-auth-user=940132245@qq.com
set smtp-auth-password=
[root@localhost opt]#vim keepalive.sh
#!/bin/bash
#
contact='940132245@qq.com'
notify() {
mailsubject="$(hostname) to be $1, vip floating"
mailbody="$(date +'%F %T'): vrrp transition, $(hostname) changed to be $1"
echo "$mailbody" | mail -s "$mailsubject" $contact
}
case $1 in
master)
notify master
;;
backup)
notify backup
;;
fault)
notify fault
;;
*)
echo "Usage: $(basename $0) {master|backup|fault}"
exit 1
;;
esac

[root@localhost opt]#vim /etc/keepalived/keepalived.conf
vrrp_instance VI_1 {
state BACKUP
interface ens33
virtual_router_id 51
priority 100
preempt_delay 30
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.91.16
}
notify_master "/opt/keepalive.sh master"
notify_backup "/opt/keepalive.sh backup"
notify_fault "/opt/keepalive.sh fault"
}

[root@ka1-centos7 ~]#chmod +x /etc/keepalived/keepalived.conf
#模拟master故障
[root@ka1-centos7 ~]#killall keepalived

2.4.3.4日志功能

开启单独日志功能

[root@localhost opt]#keepalived --help
#查看帮助
[root@localhost opt]#ps aux |grep keep
root 25326 0.0 0.0 118616 1372 ? Ss 11月20 0:00 /usr/sbin/keepalived -D
root 25327 0.0 0.1 127480 3336 ? S 11月20 0:01 /usr/sbin/keepalived -D
root 25328 0.0 0.1 129500 2852 ? S 11月20 0:01 /usr/sbin/keepalived -D
root 26877 0.0 0.0 112676 980 pts/0 S+ 00:37 0:00 grep --color=auto keep
[root@localhost opt]#vim /lib/systemd/system/keepalived.service
EnvironmentFile=-/etc/sysconfig/keepalived
ExecStart=/usr/sbin/keepalived $KEEPALIVED_OPTIONS
[root@localhost opt]#vim /etc/sysconfig/keepalived
KEEPALIVED_OPTIONS="-D -S 6"

[root@localhost opt]#vim /etc/rsyslog.conf
# Save boot messages also to boot.log
local7.*

/var/log/boot.log
local6.*

/var/log/keepalived.log

[root@localhost opt]#systemctl restart keepalived.service rsyslog.service
[root@localhost opt]#cat /var/log/keepalived.log
#查看日志文件

3.脑裂

#模拟脑裂
[root@localhost keepalived]#iptables -A INPUT -s 192.168.91.100 -j REJECT
#在备份主机中加入此项
[root@localhost keepalived]#ip a
#可以在主备上都发现vip地址

脑裂解释

什么是脑裂？
在高可用（HA）系统中，当联系2个节点的“心跳线”断开时，本来为一整体、动作协调的HA系统，
就分裂成为2个独立的个体。
由于相互失去了联系，都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样，争抢“共享
资源”、争起“应用服务”，就会发生严重后果。共享资源被瓜分、两边“服务”都起不来了；或者两边
“服务”都起来了，但同时读写“共享存储”，导致数据损坏

都有哪些原因导致脑裂？
高可用服务器对之间心跳线链路发生故障，导致无法正常通信。
因心跳线坏了（包括断了，老化）。
因网卡及相关驱动坏了，ip配置及冲突问题（网卡直连）
因心跳线间连接的设备故障（网卡及交换机）
高可用服务器上开启了 iptables防火墙阻挡了心跳消息传输。
高可用服务器上心跳网卡地址等信息配置不正确，导致发送心跳失败
其他服务配置不当等原因，如心跳方式不同，心跳广插冲突、软件Bug等。
多组keepalive服务器造成组播冲突 1.换组播地址 2.改成单播
默认：
单播：
组播：
广播：
A 1 -127
B 128-191
C 192-223
D 224-239 224.0.0.18

20. 如何解决keepalived脑裂问题？
在实际生产环境中，我们从以下方面防止脑裂：
#同时使用串行电缆和以太网电缆连接、同时使用两条心跳线路，这样一条线路断了，另外一条还是好的，依然能传送心跳消息
#当检查脑裂时强行关闭一个心跳节点（这个功能需要特殊设备支持，如stonith、fence）相当于备节点接收不到心跳消息，通过单独的线路发送关机命令关闭主节点的电源

rsyslog 分割日志

#做好对脑裂的监控报警解决常见方案：
如果开启防火墙，一定要让心跳消息通过，一般通过允许IP段的形式解决
可以拉一条以太网网线或者串口线作为主被节点心跳线路的冗余
开发检测程序通过监控软件检测脑裂

keepalived lvs 负载均衡反向代理
lvs 高可用
后端服务器的健康性检查问题

正向代理作用：加快访问速度可以绕过防火墙
代理的客户端
我要访问 google 正向代理服务器 google 服务器

反向代理：负载均衡优化资源
代理的服务端的

客户端不需要知道服务端到底是什么样子的，只要能访问就行

keepalived 脑裂
vrrp 协议心跳线收不到

4.Keepalived解决Nginx的高可用

keepalived利用 VRRP Script 技术，可以调用外部的辅助脚本进行资源监控，并根据监控的结果实现优先动态调整，从而实现其它应用的高可用性功能

参考配置文件：

/usr/share/doc/keepalived/keepalived.conf.vrrp.localcheck

4.1VRRP Script配置

分两步实现：

定义脚本

vrrp_script：自定义资源监控脚本，vrrp实例根据脚本返回值，公共定义，可被多个实例调用，定义在vrrp实例之外的独立配置块，一般放在global_defs设置块之后。通常此脚本用于监控指定应用的状态。一旦发现应用的状态异常，则触发对MASTER节点的权重减至低于SLAVE节点，从而实现 VIP 切换到 SLAVE 节点

vrrp_script <SCRIPT_NAME> {
script <STRING>|<QUOTED-STRING> #此脚本返回值为非0时，会触发下面OPTIONS执行
OPTIONS
}

调用脚本

track_script：调用vrrp_script定义的脚本去监控资源，定义在VRRP实例之内，调用事先定义的vrrp_script

track_script {
SCRIPT_NAME_1
SCRIPT_NAME_2
}

4.2定义VRRP Scripts

vrrp_script <SCRIPT_NAME> {                #定义一个检测脚本，在global_defs 之外配置
     script <STRING>|<QUOTED-STRING>        #shell命令或脚本路径(注意执行权限)
     interval <INTEGER>                    #间隔时间，单位为秒，默认1秒
     timeout <INTEGER>                        #超时时间
     weight <INTEGER:-254..254>            #默认为0,如果设置此值为负数，当上面脚本返回值为非0时，会将此值与本节点权重相加可以降低本节点权重，即表示fall. 如果是正数，当脚本返回值为0，会将此值与本节点权重相加可以提高本节点权重，即表示 rise.通常使用负值
     fall <INTEGER>                          #执行脚本连续几次都失败,则转换为失败，建议设为2以上
     rise <INTEGER>                          #执行脚本连续几次都成功，把服务器从失败标记为成功
     user USERNAME [GROUPNAME]                #执行监测脚本的用户或组
     init_fail                                #设置默认标记为失败状态，监测成功之后再转换为成功状态
}