Redis主从及哨兵模式
Redis主从及哨兵模式
在主从模式的Redis系统中,从数据库在整个系统中起到了数据 冗余备份和 读写分离的作用,但是当数据库遇到异常中断服务后,我们只能通过手动的方式选择一个从数据库来升格为主数据库,显然这种方式很麻烦需要人工介入,这时通过哨兵模式可以实现自动化的系统监控和故障恢复。
redis主从模式的结构
Redis,的主从结构可以采用一主多从或者级联结构,Redis,主从复制可以根据是否是全量分为全量同步和增量同步。
全量同步
Redis.全量复制一般发生在Slave初始化阶段,这时Slave需要将Master上的所有数据都复制一份。具体步骤如下:
1.从服务器连接主服务器,发送SYNC命令;
2.主服务器接收到SYNC命名后,开始执行BGSAVE命令生成RDB文件并使用缓冲区记录此后执行的所有写命令;
3.主服务器BGSAVE执行完后,向所有从服务器发送快照文件,并在发送期间继续记录被执行的写命令;
4.从服务器收到快照文件后丢弃所有旧数据,载入收到的快照;.
5.主服务器快照发送完毕后开始向从服务器发送缓冲区中的写命令;
6.从服务器完成对快照的载入,开始接收命令请求,并执行来自主服务器缓冲区的写命令;
增量复制
Redis增量复制是指Slave 初始化后开始正常工作时主服务器发生的写操作同步到从服务器的过程。
增量复制的过程主要是主服务器每执行一个写命令就会向从服务器发送相同的写命令,从服务器接收并执行收到的写命令。
Redis主从同步策略。
主从刚刚连接的时候,进行全量同步;全同步结束后,进行增量同步。当然,如果有需要,slave在任何时候都可以发起全量同步。redis策略是,无论如何,首先会尝试进行增量同步,如不成功,要求从机进行全量同步。
主从配置
[root@Master ~]# tar zxvf redis-5.0.4.tar.gz
[root@Master ~]# cd redis-5.0.4/
[root@Master ~]# make
[root@Master ~]# make PREFIX=/usr/local/redis install
[root@Master ~]# ln -s /usr/local/redis/bin/* /usr/local/bin/
[root@Master ~]# cd redis-5.0.4/utils/
[root@Master ~]# ./install_server.sh
./install_server.sh
Welcome to the redis service installer
This script will help you easily set up a running redis server
Please select the redis port for this instance: [6379]
Selecting default: 6379
Please select the redis config file name [/etc/redis/6379.conf]
Selected default - /etc/redis/6379.conf
Please select the redis log file name [/var/log/redis_6379.log]
Selected default - /var/log/redis_6379.log
Please select the data directory for this instance [/var/lib/redis/6379]
Selected default - /var/lib/redis/6379
Please select the redis executable path [/usr/local/bin/redis-server]
Selected config:
Port : 6379
Config file : /etc/redis/6379.conf
Log file : /var/log/redis_6379.log
Data dir : /var/lib/redis/6379
Executable : /usr/local/bin/redis-server
Cli Executable : /usr/local/bin/redis-cli
Is this ok? Then press ENTER to go on or Ctrl-C to abort.
Copied /tmp/6379.conf => /etc/init.d/redis_6379
Installing service...
Successfully added to chkconfig!
Successfully added to runlevels 345!
Starting Redis server...
Installation successful!
[root@Master ~]# vi /etc/redis/6379.conf
bind 0.0.0.0 #第69行 监听地址 生产环境中为从服务器地址
daemonize yes #第136行 开启守护进程
logfile /var/log/redis_6379.log #第172行 修改日志文件目录
dir /var/lib/redis/6379 #264行 修改工作目录
appendonly yes #700行,开启AOF持久化功能
[root@Master ~]# /etc/init.d/redis_6379 restart ###重启服务
配置从服务器
[root@slave ~]# vi /etc/redis/6379.conf
#slave节点
#与master节点修改一直,多修改一个同步master节点IP和端口
replicaof 192.168.100.10 6379
验证
[root@Master ~]# redis-cli -h 192.168.100.10
192.168.100.10:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=192.168.100.30,port=6379,state=online,offset=308,lag=1
slave1:ip=192.168.100.20,port=6379,state=online,offset=308,lag=1
查看日志文件
[root@Master ~]# cat /var/log/redis_6379.log
53684:M 20 Dec 2020 11:45:50.838 * Replica 192.168.100.30:6379 asks for synchronization
53684:M 20 Dec 2020 11:45:50.838 * Full resync requested by replica 192.168.100.30:6379
53684:M 20 Dec 2020 11:45:51.913 * Synchronization with replica 192.168.100.30:6379 succeeded
53684:M 20 Dec 2020 11:45:52.415 * Replica 192.168.100.20:6379 asks for synchronization
53684:M 20 Dec 2020 11:45:52.415 * Full resync requested by replica 192.168.100.20:6379
53684:M 20 Dec 2020 11:45:52.416 * Synchronization with replica 192.168.100.20:6379 succeeded
哨兵模式原理
哨兵(sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的master并将所有slave连接到新的master。所以整个运行哨兵的集群的数量不得少于3个节点。
哨兵模式的作用
1.监控
不断的检查master和slave是否正常运行。
master存活检测、master与slave运行情况检测
2.通知(提醒)
当被监控的服务器出现问题时,向其他(哨兵间,客户端)发送通知。
3.自动故障转移
断开master与slave连接,选取一个slave作为master,将其他slave连接到新的master,并告知客户端新的服务器地址
PS:哨兵也是一台redis服务器,只是不提供数据服务
哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式,所有节点上都需要部署哨兵模式,哨兵模式会监控所有的redis工作节点是否正常,当master出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就认为这个master的确出现问题,然后会通知哨兵间,然后从slaves中选取一个作为新的master
哨兵模式配置(主从全部配置)
[root@Master ~]# vi redis-5.0.4/sentinel.conf
修改添加
protected-mode no 关闭保护模式
daemonize yes 指定sentine1为后台启动,开启守护进程
logfile "/var/log/sentinel.log" 指定日志存放路径
dir /var/lib/redis/6379 指定数据库存放路径
sentinel monitor mymaster 20.0.0.10 6379 2
指定几个哨兵(slave)检测主服务器故障,才会进行故障迁移(主服务器ip地址,端口号,slave数)
sentinel down-after-milliseconds mymaster 3000
判定服务器down掉的时间周期,默认30000毫秒(30秒)
sentinel failover-timeout mymaster 180000
故障节点的最大超时时间为180000毫秒(180秒)
启动哨兵模式(先启master服务器,后启slave服务器)
[root@Master ~]# redis-sentinel redis-5.0.4/sentinel.conf &
[1] 60977
远程登录数据库查看哨兵状态
[root@Master ~]# redis-cli -h 192.168.100.10 -p 26379
192.168.100.10:26379> info sentinel
# Sentinel
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
master0:name=mymaster,status=ok,address=192.168.100.20:6379,slaves=2,sentinels=3
[root@Master ~]# redis-cli -h 192.168.100.10 -p 6379 info replication
# Replication
role:master
connected_slaves:0
master_replid:9976e191723b9119ce27ecba5226f00bfcbaab39
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
停止主服务器,查看状态
主服务器地址变更
[root@Master ~]# /etc/init.d/redis_6379 stop 停止服务
[root@server3 ~]# redis-cli -h 192.168.100.10 -p 26379
192.168.100.10:26379> info replication
192.168.100.10:26379> info sentinel
# Sentinel
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
master0:name=mymaster,status=ok,address=192.168.100.20:6379,slaves=2,sentinels=3
从服务器上进行日志查看
[root@slave2 ~]# tail -f /var/log/sentinel.log
8143:X 21 Dec 2020 12:05:30.672 # +sdown slave 192.168.100.10:6379 192.168.100.10 6379 @ mymaster 192.168.100.20 6379
8143:X 21 Dec 2020 19:49:38.086 # +tilt #tilt mode entered
8143:X 21 Dec 2020 19:49:38.274 # +new-epoch 2
8143:X 21 Dec 2020 19:50:08.140 # -tilt #tilt mode exited
8820:X 21 Dec 2020 19:52:12.133 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
8820:X 21 Dec 2020 19:52:12.133 # Redis version=5.0.4, bits=64, commit=00000000, modified=0, pid=8820, just started
8820:X 21 Dec 2020 19:52:12.133 # Configuration loaded
8821:X 21 Dec 2020 19:52:12.134 * Increased maximum number of open files to 10032 (it was originally set to 1024).
8821:X 21 Dec 2020 19:52:12.135 # Could not create server TCP listening socket *:26379: bind: Address already in use
8143:X 21 Dec 2020 19:58:30.449 # -sdown slave 192.168.100.10:6379 192.168.100.10 6379 @ mymaster 192.168.100.20 6379