keepalived 配置详解

最新推荐文章于 2025-05-13 15:53:06 发布

搁浅mf丶

最新推荐文章于 2025-05-13 15:53:06 发布

阅读量2.2k

点赞数 3

分类专栏： keepalived 文章标签： keepalived 配置 keepalived

本文链接：https://blog.youkuaiyun.com/weixin_42256765/article/details/103223793

版权

keepalived 专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍Keepalived的工作原理及配置方法，包括VRRP协议应用、高可用HA功能实现，以及LVS配置详解。文章还提供了配置实例，帮助读者理解和应用Keepalived。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

keepalived 原理及配置介绍

什么是 Keepalived 呢，keepalived 观其名可知，保持存活，在网络里面就是保持在线了，也就是所谓的高可用或热备，用来防止单点故障(单点故障是指一旦某一点出现故障就会导致整个系统架构的不可用)的发生，Keepalived 通过请求一个 vip 来达到请求真是 IP 地址的功能，而 VIP 能够在一台机器发生故障时候，自动漂移到另外一台机器上，从来达到了高可用 HA 功能。那说到 keepalived 时不得不说的一个协议就是 VRRP 协议，可以说这个协议就是 keepalived 实现的基础，那么首先我们来看看 VRRP 协议。

VRRP 协议

网络在设计的时候必须考虑到冗余容灾，包括线路冗余，设备冗余等，防止网络存在单点故障，那在路由器或三层交换机处实现冗余就显得尤为重要，在网络里面有个协议就是来做这事的，这个协议就是 VRRP 协议，Keepalived 就是巧用 VRRP 协议来实现高可用性 (HA) 的 VRRP 协议。

Keepalived 原理

keepalived 也是模块化设计，不同模块复杂不同的功能，下面是 keepalived 的组件 core check vrrp libipfwc libipvs-2.4 libipvs-2.6
core：是 keepalived 的核心，复杂主进程的启动和维护，全局配置文件的加载解析等
check：负责 healthchecker (健康检查)，包括了各种健康检查方式，以及对应的配置的解析包括LVS的配置解析
vrrp：VRRPD 子进程，VRRPD 子进程就是来实现 VRRP 协议的
libipfwc：iptables(ipchains) 库，配置 LVS 会用到
libipvs*：配置 LVS 会用到
注意，keepalived 和 LVS 完全是两码事，只不过他们各负其责相互配合而已。

在这里插入图片描述

keepalived 启动后会有三个进程
父进程：内存管理，子进程管理等等
子进程：VRRP 子进程
子进程：healthchecker 子进程
有图可知，两个子进程都被系统 WatchDog 看管，两个子进程各自复杂自己的事，healthchecker 子进程复杂检查各自服务器的健康程度，例如 HTTP，LVS 等等，如果healthchecker 子进程检查到 MASTER 上服务不可用了，就会通知本机上的兄弟 VRRP 子进程，让他删除通告，并且去掉虚拟 IP，转换为 BACKUP 状态。

Keepalived 配置文件详解

keepalived 有三类配置区域，注意不是三种配置文件，是一个配置文件里面三种不同类别的配置区域，全局配置 (Global Configuration)、VRRPD 配置、LVS 配置。

1.global_defs 全局配置

 {

    global_defs {
        notification_email {
        acassen@firewall.loc
        failover@firewall.loc
        sysadmin@firewall.loc #邮件报警
   }

   notification_email_from Alexandre.Cassen@firewall.loc 指定发件人
   smtp_server 192.168.200.1  #指定 smtp 服务器地址
   smtp_connect_timeout 30    指定 smtp 连接超时时间
   router_id LVS_DEVEL  #负载均衡标识，在局域网内应该是唯一的。
   vrrp_skip_check_adv_addr
   vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0

}

说明:

notification_email：指定当 keepalived 出现问题时，发送邮件给哪些用户。
notification_emai_from：发送邮件时，邮件的来源地址。
smtp_server <DOMAIN|IP> [PORT]：smtp 服务器的地址或域名。默认端口为 25, 如：smtp_server smtp.felix.com 25
smtp_helo_name <HOST_NAME>：指定在 HELO 消息中所使用的名称。默认为本地主机名。
smtp_connect_timeout：指定 smtp 服务器连接的超时时间。单位是秒。
router_id：指定标识该机器的 route_id. 如：route_id LVS_01
vrrp_mcast_group4 224.0.0.18：指定发送 VRRP 组播消息使用的 IPV4 组播地址。默认是224.0.0.18
vrrp_mcast_group6 ff02::12 指定发送 VRRP 组播消息所使用的 IPV6 组播地址。默认是ff02::12
default_interface eth0：设置静态地址默认绑定的端口。默认是 eth0。
lvs_sync_daemon <VRRP_INSTANCE> [id <SYNC_ID>] [maxlen ] [port ] [ttl ] [group ] 设置 LVS 同步服务的相关内容。可以同步 LVS 的状态信息。
INTERFACE：指定同步服务绑定的接口。
VRRP_INSTANCE：指定同步服务绑定的 VRRP 实例。
id <SYNC_ID>：指定同步服务所使用的 SYNCID，只有相同的 SYNCID 才会同步。范围是0-255.
maxlen：指定数据包的最大长度。范围是 1-65507
port：指定同步所使用的 UDP 端口。
group：指定组播 IP 地址。
lvs_flush：在 keepalived 启动时，刷新所有已经存在的 LVS 配置。
vrrp_garp_master_delay 10：当转换为 MASTER 状态时，延迟多少秒发送第二组的免费 ARP。默认为 5s，0 表示不发送第二组免的免费 ARP。
vrrp_garp_master_repeat 1：当转换为 MASTER 状态时，在一组中一次发送的免费 ARP 数量。默认是 5.
vrrp_garp_lower_prio_delay 10：当 MASTER 收到更低优先级的通告时，延迟多少秒发送第二组的免费 ARP。
vrrp_garp_lower_prio_repeat 1：当 MASTER 收到更低优先级的通告时，在一组中一次发送的免费 ARP 数量。
vrrp_garp_master_refresh 60：当 keepalived 成为 MASTER 以后，刷新免费 ARP 的最小时间间隔(会再次发送免费 ARP)。默认是 0，表示不会刷新。
vrrp_garp_master_refresh_repeat 2：当 keepalived 成为 MASTER 以后，每次刷新会发送多少个免费 ARP。默认是 1.
vrrp_garp_interval 0.001：在一个接口发送的两个免费 ARP 之间的延迟。可以精确到毫秒级。默认是 0.
vrrp_lower_prio_no_advert true|false：默认是 false。如果收到低优先级的通告，不发送任何通告。
vrrp_version 2|3：设置默认的 VRRP 版本。默认是 2.
vrrp_check_unicast_src：在单播模式中，开启对 VRRP 数据包的源地址做检查，源地址必须是单播邻居之一。
vrrp_skip_check_adv_addr：默认是不跳过检查。检查收到的 VRRP 通告中的所有地址可能会比较耗时，设置此命令的意思是，如果通告与接收的上一个通告来自相同的 master 路由器，则不执行检查(跳过检查)。
vrrp_strict：严格遵守 VRRP 协议。下列情况将会阻止启动 Keepalived：1. 没有 VIP 地址。2. 单播邻居。3. 在 VRRP 版本 2 中有 IPv6 地址。
vrrp_iptables：不添加任何 iptables 规则。默认是添加 iptables 规则的。
如果 vrrp 进程或 check 进程超时，可以用下面的 4 个选项。可以使处于 BACKUP 状态的 VRRP 实例变成 MASTER 状态，即使 MASTER 实例依然在运行。因为 MASTER 或 BACKUP 系统比较慢，不能及时处理 VRRP 数据包。
vrrp_priority <-20 – 19>：设置 VRRP 进程的优先级。
checker_priority <-20 – 19>：设置 checker 进程的优先级。
vrrp_no_swap：vrrp 进程不能够被交换。
checker_no_swap：checker 进程不能够被交换。
script_user [groupname]：设置运行脚本默认用户和组。如果没有指定，则默认用户为 keepalived_script (需要该用户存在)，否则为 root 用户。默认 groupname 同 username。
enable_script_security：如果脚本路径的任一部分对于非 root 用户来说，都具有可写权限，则不会以 root 身份运行脚本。
nopreempt 默认是抢占模式要是用非抢占式的就加上 nopreempt

2.VRRPD 配置

vrrp_script

作用：添加一个周期性执行的脚本。脚本的退出状态码会被调用它的所有的 VRRP Instance 记录。
注意：至少有一个 VRRP 实例调用它并且优先级不能为 0.优先级范围是 1-254.

vrrp_script <SCRIPT_NAME> {
          ...
    }

选项说明：

scrip “/path/to/somewhere”：指定要执行的脚本的路径。
interval ：指定脚本执行的间隔。单位是秒。默认为1s。
timeout ：指定在多少秒后，脚本被认为执行失败。
weight <-254 — 254>：调整优先级。默认为2.

如果脚本执行成功(退出状态码为 0)，weight 大于 0，则 priority 增加。
如果脚本执行失败(退出状态码为非 0)，weight 小于0，则 priority 减少。
其他情况下，priority 不变。

rise ：执行成功多少次才认为是成功。
fall ：执行失败多少次才认为失败。
user [GROUPNAME]：运行脚本的用户和组。
init_fail：假设脚本初始状态是失败状态。

vrrp_sync_group

作用：将所有相关的 VRRP 实例定义在一起，作为一个 VRRP Group，如果组内的任意一个实例出现问题，都可以实现 Failov


    vrrp_sync_group VG_1 {

        group {
            inside_network     # vrrp instance name
            outside_network    # vrrp instance name
            ...
        }
    ...
}

说明：

如果 username 和 groupname 没有指定，则以默认的 script_user 所指定的用户和组。

notify_master /path/to_master.sh [username [groupname]]
作用：当成为 MASTER 时，以指定的用户和组执行脚本。
notify_backup /path/to_backup.sh [username [groupname]]
作用：当成为 BACKUP 时，以指定的用户和组执行脚本。
notify_fault “/path/fault.sh VG_1” [username [groupname]]
作用：当该同步组 Fault 时，以指定的用户和组执行脚本。
notify /path/notify.sh [username [groupname]]
作用：在任何状态都会以指定的用户和组执行脚本。
说明：该脚本会在 notify_* 脚本后执行。

notify 可以使用 3 个参数，如下：
a. 可以是 GROUP 或 INTANCE，表明后面是组还是实例.
b. 组名或实例名。
c. 转换后的目标状态。有：MASTER、BACKUP、FAULT。
smtp_alert：当状态发生改变时，发送邮件。
global_tracking：所有的 VRRP 实例共享相同的 tracking 配置。

vrrp_instance

   vrrp_instance VI_1 {

        state MASTER 指定该 keepalived 节点的初始状态
        interface ens8 vrrp 实例绑定的接口，用于发送 VRRP 包
        virtual_router_id 51  指定 VRRP 实例 ID
        priority 150  指定优先级，优先级高的将成为 MASTER
        nopreempt   设置为不抢占。默认是抢占的
        advert_int 1   advert_int 1

        authentication {
            auth_type PASS  指定认证方式
            auth_pass password 指定认证所使用的密码。
        }

        virtual_ipaddress {  
            192.168.1.217 dev ens8  指定 VIP 地址
        }
}

命令说明：

state MASTER|BACKUP：指定该 keepalived 节点的初始状态。
interface eth0：vrrp 实例绑定的接口，用于发送 VRRP 包。
use_vmac [VMAC_INTERFACE]：在指定的接口产生一个子接口，如 vrrp.51，该接口的 MAC 地址为组播地址，通过该接口向外发送和接收 VRRP 包。
vmac_xmit_base：通过基本接口向外发送和接收 VRRP 数据包，而不是通过 VMAC 接口。
native_ipv6：强制 VRRP 实例使用 IPV6.(当同时配置了 IPV4 和 IPV6 的时候)
dont_track_primary：忽略 VRRP 接口的错误，默认是没有配置的。

track_interface {
  eth0
  eth1 weight <-254-254>
  ...
}

如果 track 的接口有任何一个出现故障，都会进入 FAULT 状态。

track_script {
  <SCRIPT_NAME>
  <SCRIPT_NAME> weight <-254-254>
}

添加一个 track 脚本( vrrp_script 配置的脚本。)

mcast_src_ip ：指定发送组播数据包的源 IP 地址。默认是绑定 VRRP 实例的接口的主 IP 地址。
unicast_src_ip ：指定发送单薄数据包的源 IP 地址。默认是绑定 VRRP 实例的接口的主 IP 地址。
version 2|3：指定该实例所使用的 VRRP 版本。

unicast_peer {
   <IPADDR>
   ...
}

采用单播的方式发送 VRRP 通告，指定单播邻居的 IP 地址。

virtual_router_id 51：指定 VRRP 实例 ID，范围是 0-255.
priority 100：指定优先级，优先级高的将成为 MASTER。
advert_int 1：指定发送 VRRP 通告的间隔。单位是秒。

authentication {
  auth_type PASS|AH：指定认证方式。PASS 简单密码认证(推荐), AH:IPSEC 认证(不推荐)。
  auth_pass 1234：指定认证所使用的密码。最多 8 位。
}

virtual_ipaddress {
   <IPADDR>/<MASK> brd <IPADDR> dev <STRING> scope <SCOPE> label <LABEL>
   192.168.200.17/24 dev eth1
   192.168.200.18/24 dev eth2 label eth2:1
}

指定VIP地址。

nopreempt：设置为不抢占。默认是抢占的，当高优先级的机器恢复后，会抢占低优先级的机器成为 MASTER，而不抢占，则允许低优先级的机器继续成为 MASTER，即使高优先级的机器已经上线。如果要使用这个功能，则初始化状态必须为 BACKUP。
preempt_delay：设置抢占延迟。单位是秒，范围是 0—1000，默认是 0. 发现低优先级的 MASTER 后多少秒开始抢占。

通知脚本：

notify_master | [username [groupname]]
notify_backup | [username [groupname]]
notify_fault | [username [groupname]]
notify | [username [groupname]]

当停止 VRRP 时执行的脚本。

notify_stop | [username [groupname]]
smtp_alert

3. LVS 配置

virtual_server

virtual_server IP Port | virtual_server fwmark int | virtual_server group string {

  delay_loop <INT>：健康检查的时间间隔。

  lb_argo rr|wrr|lc|wlc|lblc|sh|dh：LVS 调度算法。

  lb_kind NAT|DR|TUN：LVS 模式。

  persistence_timeout 360：持久化超时时间，单位是秒。默认是6分钟。

  persistence_granularity：持久化连接的颗粒度。

  protocol TCP|UDP|SCTP：4 层协议。

  ha_suspend：如果virtual server 的 IP 地址没有设置，则不进行后端服务器的健康检查。

  virtualhost <STRING>：为 HTTP_GET 和 SSL_GET 执行要检查的虚拟主机。如virtualhost www.felix.com

  sorry_server <IPADDR> <PORT>：添加一个备用服务器。当所有的 RS 都故障时。

  sorry_server_inhibit：将inhibit_on_failure 指令应用于 sorry_server 指令。

  alpha：在 keepalived 启动时，假设所有的 RS 都是 down，以及健康检查是失败的。有助于防止 启动时的误报。默认是禁用的。

  omega：在 keepalived 终止时，会执行 quorum_down 指令所定义的脚本。

  quorum <INT>：默认值 1. 所有的存活的服务器的总的最小权重。

  quorum_up <STRING>：当 quorum 增长到满足 quorum 所定义的值时，执行该脚本。

  quorum_down <STRING>：当 quorum 减少到不满足 quorum 所定义的值时，执行该脚本。

}

real_server

real_server IP Port {

  weight <INT>：给服务器指定权重。默认是 1.
  inhibit_on_failure：当服务器健康检查失败时，将其 weight 设置为 0，而不是从 Virtual Server 中移除。
  notify_up <STRING>：当服务器健康检查成功时，执行的脚本。
  notify_down <STRING>：当服务器健康检查失败时，执行的脚本。
  uthreshold <INT>：到这台服务器的最大连接数。
  lthreshold <INT>：到这台服务器的最小连接数。
}

Real_server 中的健康检查

下面是常用的健康检查方式，健康检查方式一共有 HTTP_GET、SSL_GET、TCP_CHECK、SMTP_CHECK、MISC_CHECK 这些。

HTTP_GET | SSL_GET 方式

指定路径 url 进行配置查询


HTTP_GET | SSL_GET {
    url {
        path <STRING>：指定要检查的 URL 的路径。如 path / or path /mrtg2

        digest <STRING>：摘要。计算方式：genhash -s 172.17.100.1 -p 80 -u /
        index.

        status_code <INT>：状态码。
    }

        nb_get_retry <INT>：get 尝试次数。
        delay_before_retry <INT>：在尝试之前延迟多长时间。

        connect_ip <IP ADDRESS>：连接的 IP 地址。默认是 real server 的 ip 地址。

        connect_port <PORT>：连接的端口。默认是 real server 的端口。

        bindto <IP ADDRESS>：发起连接的接口的地址。

        bind_port <PORT>：发起连接的源端口。

        connect_timeout <INT>：连接超时时间。默认是 5s。

        fwmark <INTEGER>：使用 fwmark 对所有出去的检查数据包进行标记。

        warmup <INT>：指定一个随机延迟，最大为 N 秒。可防止网络阻塞。如果为 0，则关闭该功能。

}

TCP_CHECK 方式

通过连接 tcp 端口判断是否活跃。


TCP_CHECK {

    connect_ip <IP ADDRESS>：连接的 IP 地址。默认是 real server 的 ip 地址。

    connect_port <PORT>：连接的端口。默认是 real server 的端口。

    bindto <IP ADDRESS>：发起连接的接口的地址。

    bind_port <PORT>：发起连接的源端口。

    connect_timeout <INT>：连接超时时间。默认是 5s。

    fwmark <INTEGER>：使用 fwmark 对所有出去的检查数据包进行标记。

    warmup <INT>：指定一个随机延迟，最大为 N 秒。可防止网络阻塞。如果为 0，则关闭该功能。

    retry <INIT>：重试次数。默认是 1 次。

    delay_before_retry <INT>：默认是 1 秒。在重试之前延迟多少秒。

}

SMTP_CHECK 方式

这个可以用来给邮件服务器做集群。


SMTP_CHECK {

    connect_ip <IP ADDRESS>：连接的 IP 地址。默认是 real server 的 ip 地址。

    connect_port <PORT>：连接的端口。默认是 real server 的端口。 默认是 25 端口

    bindto <IP ADDRESS>：发起连接的接口的地址。

    bind_port <PORT>：发起连接的源端口。

    connect_timeout <INT>：连接超时时间。默认是 5s。

    fwmark <INTEGER>：使用 fwmark 对所有出去的检查数据包进行标记。

    warmup <INT>：指定一个随机延迟，最大为 N 秒。可防止网络阻塞。如果为 0，则关闭该功能。

    retry <INT>：重试次数。

    delay_before_retry <INT>：在重试之前延迟多少秒。

    helo_name <STRING>：用于 SMTP HELO 请求的字符串。

}

DNS_CHECK 方式

DNS_CHECK {

    connect_ip <IP ADDRESS>：连接的 IP 地址。默认是 real server 的 ip 地址。

    connect_port <PORT>：连接的端口。默认是 real server 的端口。 默认是 25 端口

    bindto <IP ADDRESS>：发起连接的接口的地址。

    bind_port <PORT>：发起连接的源端口。

    connect_timeout <INT>：连接超时时间。默认是 5s。

    fwmark <INTEGER>：使用 fwmark 对所有出去的检查数据包进行标记。

    warmup <INT>：指定一个随机延迟，最大为 N 秒。可防止网络阻塞。如果为 0，则关闭该功能。

    retry <INT>：重试次数。默认是 3 次。

    type <STRING>：DNS query type。A/NS/CNAME/SOA/MX/TXT/AAAA

    name <STRING>：DNS 查询的域名。默认是(.)
}

MISC_CHECK 方式

非常精确的来调整权重，是后端每天服务器的压力都能均衡调配，这个主要是通过执行的程序或脚本返回的状态代码来动态调整 weight 值，使权重根据真实的后端压力来适当调整。

MISC_CHECK {
    misc_path <STRING>：外部的脚本或程序路径。
    
    misc_timeout <INT>：脚本执行超时时间。

    user USERNAME [GROUPNAME]：指定运行该脚本的用户和组。如果没有指定 GROUPNAME，则 GROUPNAME 同 USERNAME。

    misc_dynamic：根据退出状态码动态调整权重。
        0，健康检查成功，权重不变。
        1，健康检查失败。
        2-255，健康检查成功。权重设置为退出状态码减去 2.如退出状态码是 250，则权重调整为248

    warmup <INT>：指定一个随机延迟，最大为 N 秒。可防止网络阻塞。如果为 0，则关闭该功能。
}

配置实例

master 主配置与 backup 配置中 state、interface、priority 不相同，其他配置可通用

! Configuration File for keepalived

#常规配置master
global_defs {
    #配置接受异常短信人邮箱
   notification_email {
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   #配置短信发送者
   notification_email_from Alexandre.Cassen@firewall.loc
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}

#配置执行脚本文件
vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 5
}

#keepalive 主配置，主从机器除 state、interface、priority 不一致以外，其他保持一致
vrrp_instance VI_1 {
    #MASTER为主方，BACKUP为从方
    state MASTER
    #eth0 为网卡信息，不同机器可使用不同 指令:IP a
    interface eth0
    #指定 VRRP 实例 ID，范围是 0-255
    virtual_router_id 51
    #指定优先级，优先级高的将成为 MASTER
    priority 100
    #指定发送 VRRP 通告的间隔。单位是秒
    advert_int 1
    authentication {
        #指定认证方式。PASS 简单密码认证(推荐), AH:IPSEC 认证(不推荐)。
        auth_type PASS
        #指定认证所使用的密码。最多 8 位
        auth_pass 1111
    }
    #指定 VIP 地址，主从必须一致
    virtual_ipaddress {
        192.168.1.100
    }
    #添加一个 track 脚本( vrrp_script 配置的脚本。)
    track_script {
        chk_nginx
    }
}
#健康检查
virtual_server 192.168.1.100 80 {
    delay_loop 3  delay_loop
    lvs_sched rr  LVS 的调度算法
    lvs_method DR   LVS 模式
    protocol TCP  4层协议

    real_server 192.168.1.52 80 {
        weight 1  #给服务器指定权重。默认是 1
        inhibit_on_failure：当服务器健康检查失败时，将其 weight 设置为0，而不是从Virtual Server中移除。
        notify_up <STRING>：当服务器健康检查成功时，执行的脚本。
        notify_down <STRING>：当服务器健康检查失败时，执行的脚本。
        uthreshold <INT>：到这台服务器的最大连接数。
        lthreshold <INT>：到这台服务器的最小连接数。
        #检查方式，公用HTTP_GET | SSL_GET、TCP_CHECK、SMTP_CHECK、DNS_CHECK、MISC_CHECK
        TCP_CHECK {
            connect_port 80
            connect_timeout 3
            nb_get_retry 3  get尝试次数
            delay_before_retry 10  在尝试之前延迟多长时间
        }
    }

    real_server 192.168.1.53 80 {
        weight 1 #给服务器指定权重。默认是1
        TCP_CHECK {
            connect_port 80
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 10
        }
    }
}

Check_ng.sh 脚本配置

#!/bin/bash
#时间变量，用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算 nginx 进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为 0，则关闭 keepalived
if [ $n -eq "0" ]; 
    then
        #linux 系统关闭服务方式
        service keepalived stop
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                #centos 关闭服务方式
                systemctl stop keepalived
        fi
fi

脚本加入授权

[root@localhost /]# chmod 755 /usr/local/sbin/check_ng.sh