Redis进阶之持久化机制及主从复制（干货满满）

最新推荐文章于 2024-09-06 17:19:53 发布

♚焕蓝·未来

最新推荐文章于 2024-09-06 17:19:53 发布

阅读量875

点赞数 1

分类专栏： Redis 文章标签： redis 数据库缓存

本文链接：https://blog.youkuaiyun.com/weixin_47824895/article/details/129891945

版权

Redis 专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了Redis的两种持久化机制RDB和AOF，包括它们的优缺点、工作原理和配置方法。RDB提供数据快照，适合全量备份，而AOF记录写操作日志，保障数据安全性。此外，文章还讨论了Redis的主从复制策略，包括复制原理、模式和故障恢复，以及哨兵模式在高可用性中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

各位伙伴们，大家好！由于篇幅较长，所以笔者将采用多篇Blog发布的形式来方便大家阅读，整篇Blog全程干货满满，给大家带来不便敬请谅解！
最后附上前篇Blog链接：Redis进阶之发布订阅及事务机制（干货满满），如有需要的小伙伴可点击查看哦~

Redis

1 Redis持久化之RDB

1.1 总体介绍

什么是持久化？

利用永久性存储介质将数据进行保存，在特定的时间将保存的数据进行恢复的工作机制称为持久化
持久化用于防止数据的意外丢失，确保数据安全性

Redis 提供了2个不同形式的持久化方式。

RDB（Redis DataBase）：直接将内存中的数据持久化硬盘
AOF（Append Of File）：保存的执行的命令

1.2 RDB（Redis DataBase）

1.2.1 RDB是什么

在指定的时间间隔内将内存中的数据集快照写入磁盘，也就是行话讲的Snapshot快照，它恢复时是将快照文件直接读到内存里

1.2.2 备份是如何执行的

Redis会单独创建（fork）一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。整个过程中，主进程是不进行任何IO操作的，这就确保了极高的性能如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。

1.2.3 Fork

在Linux程序中，fork()会产生一个和父进程完全相同的子进程，出于效率考虑，Linux中引入了“写时复制技术”
一般情况父进程和子进程会共用同一段物理内存，只有进程空间的各段的内容要发生变化时，才会将父进程的内容复制一份给子进程。

1.2.4 dump.rdb文件

在redis.conf中配置文件名称，默认为dump.rdb

1.2.5 配置位置

rdb文件的保存路径，也可以修改。默认为Redis启动时命令行所在的目录下

dir “/myredis/”

1.2.6 如何触发RDB快照；保持策略

1、配置文件中默认的快照配置

2、命令save VS bgsave

save ：save时只管保存。save指令的执行会阻塞当前Redis服务器，直到当前RDB过程完成为止，有可能会造成长时间阻塞，线上环境不建议使用。

bgsave：Redis会在后台异步进行快照操作，快照同时还可以响应客户端请求。

3、flushall命令

执行flushall命令，也会产生dump.rdb文件，但里面是空的，无意义

4、SNAPSHOTTING快照

5、Save

格式：save 秒钟写操作次数

RDB是整个内存的压缩过的Snapshot，RDB的数据结构，可以配置复合的快照触发条件，

默认是1分钟内改了1万次，或5分钟内改了10次，或15分钟内改了1次。

禁用：不设置save指令，或者给save传入空字符串

6、stop-writes-on-bgsave-error

当Redis无法写入磁盘的话，直接关掉Redis的写操作。推荐yes.

7、rdbcompression 压缩文件

对于存储到磁盘中的快照，可以设置是否进行压缩存储。如果是的话，redis会采用LZF算法进行压缩。

如果你不想消耗CPU来进行压缩的话，可以设置为关闭此功能。推荐yes.

8、rdbchecksum 检查完整性

在存储快照后，还可以让redis使用CRC64算法来进行数据校验，

但是这样做会增加大约10%的性能消耗，如果希望获取到最大的性能提升，可以关闭此功能

推荐yes.

9、rdb的备份

先通过config get dir 查询rdb文件的目录

将*.rdb的文件拷贝到别的地方

rdb的恢复

关闭Redis
先把备份的文件拷贝到工作目录下 cp dump2.rdb dump.rdb
启动Redis, 备份数据会直接加载

1.2.7 优势

RDB是一个紧凑压缩的二进制文件，存储效率较高
RDB内部存储的是redis在某个时间点的数据快照，非常适合用于数据备份，全量复制等场景
RDB恢复数据的速度要比AOF快很多
应用：服务器中每X小时执行bgsave备份，并将RDB文件拷贝到远程机器中，用于灾难恢复。

1.2.8 劣势

Fork的时候，内存中的数据被克隆了一份，大致2倍的膨胀性需要考虑
虽然Redis在fork时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
在备份周期在一定间隔时间做一次备份，所以如果Redis意外down掉的话，就会丢失最后一次快照后的所有修改。
RDB方式无论是执行指令还是利用配置，无法做到实时持久化，具有较大的可能性丢失数据
bgsave指令每次运行要执行fork操作创建子进程，要牺牲掉一些性能
Redis的众多版本中未进行RDB文件格式的版本统一，有可能出现各版本服务之间数据格式无法兼容现象

2 Redis持久化之AOF

2.1 AOF（Append Only File）

2.1.1 AOF是什么

以日志的形式来记录每个写操作（增量保存），将Redis执行过的所有写指令记录下来(读操作不记录)，只许追加文件但不可以改写文件，redis启动之初会读取该文件重新构建数据，换言之，redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

2.1.2 AOF持久化流程

（1）客户端的请求写命令会被append追加到AOF缓冲区内；

（2）AOF缓冲区根据AOF持久化策略[always,everysec,no]将操作sync同步到磁盘的AOF文件中；

（3）AOF文件大小超过重写策略或手动重写时，会对AOF文件rewrite重写，压缩AOF文件容量；

（4）Redis服务重启时，会重新load加载AOF文件中的写操作达到数据恢复的目的；

2.1.3 AOF默认不开启

可以在redis.conf中配置文件名称，默认为 appendonly.aof

AOF文件的保存路径，同RDB的路径一致。

2.1.4 AOF和RDB同时开启，redis听谁的？

AOF和RDB同时开启，两个都生效

2.1.5 AOF启动/修复/恢复

AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样，都是拷贝备份文件，需要恢复时再拷贝到Redis工作目录下，启动系统即加载。
正常恢复
- 修改默认的appendonly no，改为yes
- 将有数据的aof文件复制一份保存到对应目录(查看目录：config get dir)
- 恢复：重启redis然后重新加载
异常恢复
- 修改默认的appendonly no，改为yes
- 如遇到AOF文件损坏，通过/usr/local/bin/redis-check-aof --fix appendonly.aof进行恢复
- 备份被写坏的AOF文件
- 恢复：重启redis，然后重新加载

2.1.6 AOF同步频率设置

appendfsync always

始终同步，每次Redis的写入都会立刻记入日志；性能较差但数据完整性比较好
appendfsync everysec

每秒同步，每秒记入日志一次，如果宕机，本秒的数据可能丢失。
appendfsync no

redis不主动进行同步，把同步时机交给操作系统。

2.1.7 Rewrite压缩

1是什么：

AOF采用文件追加方式，文件会越来越大为避免出现此种情况，新增了重写机制, 当AOF文件的大小超过所设定的阈值时，Redis就会启动AOF文件的内容压缩，只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof

2重写原理，如何实现重写

AOF文件持续增长而过大时，会fork出一条新进程来将文件重写(也是先写临时文件最后再rename)，redis4.0版本后的重写，是指上就是把rdb 的快照，以二级制的形式附在新的aof头部，作为已有的历史数据，替换掉原来的流水账操作。

no-appendfsync-on-rewrite：

如果 no-appendfsync-on-rewrite=yes ,不写入aof文件只写入缓存，用户请求不会阻塞，但是在这段时间如果宕机会丢失这段时间的缓存数据。（降低数据安全性，提高性能）

如果 no-appendfsync-on-rewrite=no, 还是会把数据往磁盘里刷，但是遇到重写操作，可能会发生阻塞。（数据安全，但是性能降低）

触发机制，何时重写

Redis会记录上次重写时的AOF大小，默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发

重写虽然可以节约大量磁盘空间，减少恢复时间。但是每次重写还是有一定的负担的，因此设定Redis要满足一定条件才会进行重写。

auto-aof-rewrite-percentage：设置重写的基准值，文件达到100%时开始重写（文件是原来重写后文件的2倍时触发）

auto-aof-rewrite-min-size：设置重写的基准值，最小文件64MB。达到这个值开始重写。

例如：文件达到70MB开始重写，降到50MB，下次什么时候开始重写？100MB

系统载入时或者上次重写完毕时，Redis会记录此时AOF大小，设为base_size,

如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)的情况下，Redis会对AOF进行重写。

3、重写流程

（1）bgrewriteaof触发重写，判断是否当前有bgsave或bgrewriteaof在运行，如果有，则等待该命令结束后再继续执行。

（2）主进程fork出子进程执行重写操作，保证主进程不会阻塞。

（3）子进程遍历redis内存中数据到临时文件，客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。

（4）子进程写完新的AOF文件后，向主进程发信号，父进程更新统计信息。2).主进程把aof_rewrite_buf中的数据写入到新的AOF文件。

（5）使用新的AOF文件覆盖旧的AOF文件，完成AOF重写。

2.1.8 优势

备份机制更稳健，丢失数据概率更低。
可读的日志文本，通过操作AOF稳健，可以处理误操作。

2.1.9 劣势

比起RDB占用更多的磁盘空间。
恢复备份速度要慢。
每次读写都同步的话，有一定的性能压力。
存在个别Bug，造成恢复失败

2.2 用哪个好(Which one)

对数据非常敏感，建议使用默认的AOF持久化方案
- AOF持久化策略使用everysecond，每秒钟fsync一次。该策略redis仍可以保持很好的处理性能，当出现问题时，最多丢失0-1秒内的数据。
- 注意：由于AOF文件存储体积较大，且恢复速度较慢
数据呈现阶段有效性，建议使用RDB持久化方案
- 数据可以良好的做到阶段内无丢失（该阶段是开发者或运维人员手工维护的），且恢复速度较快，阶段点数据恢复通常采用RDB方案
- 注意：利用RDB实现紧凑的数据持久化会使Redis降的很低，慎重总结：
综合比对
- RDB与AOF的选择实际上是在做一种权衡，每种都有利有弊
- 如不能承受数分钟以内的数据丢失，对业务数据非常敏感，选用AOF
- 如能承受数分钟以内的数据丢失，且追求大数据集的恢复速度，选用RDB
- 灾难恢复选用RDB

3 Redis_主从复制

3.1 是什么

主机数据更新后根据配置和策略，自动同步到备机的master/slaver机制，Master以写为主，Slave以读为主

3.2 能干嘛

读写分离，性能扩展
容灾快速恢复

3.3 怎么玩：主从复制

拷贝多个redis.conf文件include(写绝对路径)

开启daemonize yes

Pid文件名字pidfile

指定端口port

Log文件名字

dump.rdb名字dbfilename

3.4 新建redis*.conf配置文件

在/usr/myredis目录下新建三个文件，填写如下内容

【第一步】修改/usr/myredis/redis.conf文件，将appendonly的值修改为no

【第二步】新建redis6379.conf

include /usr/myredis/redis.conf
pidfile /var/run/redis_6379.pid
port 6379
dbfilename dump6379.rdb

【第三步】新建redis6380.conf，填写以下内容

【第四步】新建redis6381.conf，填写以下内容

slave-priority 10

设置从机的优先级，值越小，优先级越高，用于选举主机时使用。默认100

【第五步】启动三台redis服务器

【第六步】查看系统进程，看看三台服务器是否启动

【第七步】查看三台主机运行情况

info replication

【第八步】配从(库)不配主(库)

slaveof

成为某个实例的从服务器

1、在6380和6381上执行: slaveof 127.0.0.1 6379

2、在主机上写，在从机上读

在从机上写数据报错

3、主机挂掉，重启就行，一切如初

4、从机重启需重设：slaveof 127.0.0.1 6379

可以将配置增加到文件中。永久生效。

3.5 主从集群常用3招

3.5.1 主从模式一:一主二从

slave1、slave2是从头开始复制还是从切入点开始复制?比如从k4进来，那之前的k1,k2,k3是否也可以复制？

答：不管从机何时加入主从集群，第一次都是全量复制，后面进行增量复制

从机是否可以写？set可否？

答：从机不可以写入，不可以执行set，会报错

主机shutdown后情况如何？从机是上位还是原地待命？

答：原地待命

主机又回来了后，主机新增记录，从机还能否顺利复制？

答：主机回来了，主机还是主机，从机还是可以继续复制的

其中一台从机down后情况如何？依照原有它能跟上大部队吗？

答：从机down机之后，重启，执行slaveof命令，第一次进行全量复制，后面进行增量复制

3.5.2 主从模式二：薪火相传

上一个Slave可以是下一个slave的Master，Slave同样可以接收其他 slaves的连接和同步请求，那么该slave作为了链条中下一个的master, 可以有效减轻master的写压力,去中心化降低风险。

用 slaveof

中途变更转向:会清除之前的数据，重新建立拷贝最新的

风险是一旦某个slave宕机，后面的slave都没法备份

主机挂了，从机还是从机，无法写数据了

3.5.3 主从模式三：反客为主

当一个master宕机后，后面的slave可以立刻升为master，其后面的slave不用做任何修改。

用 slaveof no one 将从机变为主机。

3.6 复制原理

当从服务器连接上主服务器之后，从服务器就会向主服务器发送一个sync命令进行数据同步操作
主服务器接到从服务器发过来的同步命令，先将主服务器数据进行持久化，生成rdb文件，然后把rdb文件发送给从服务器，从服务器拿到rdb进行读取，完成复制
每次主服务器进行写操作之后，和从服务器进行数据同步
全量复制：从机第一次连接主机，主机所有的数据将会同步给从机。
增量复制：主机继续将新的数据依次传给从机
但是只要是重新连接master,全量复制都会自动执行

3.7 哨兵模式(sentinel)

3.7.1 是什么

反客为主的自动版，能够后台监控主机是否故障，如果故障了根据投票数自动将从库转换为主库

3.7.2 怎么玩(使用步骤)

在/usr/myredis目录下新建sentinel.conf文件，名字绝不能错

【第一步】调整为一主二从模式，6379带着6380、6381

【第二步】自定义的/usr/myredis目录下新建sentinel.conf文件，名字绝不能错

【第三步】配置哨兵,填写内容

sentinel monitor mymaster 127.0.0.1 6379 1

其中mymaster为监控对象起的服务器名称， 1 为至少有多少个哨兵同意迁移的数量。

【第四步】启动哨兵

/usr/local/bin

执行redis-sentinel /usr/myredis/sentinel.conf

【第五步】当主机挂掉，从机选举中产生新的主机

(大概10秒左右可以看到哨兵窗口日志，切换了新的主机)

哪个从机会被选举为主机呢？根据优先级别：slave-priority

原主机重启后会变为从机。

【第六步】复制延时

由于所有的写操作都是先在Master上操作，然后同步更新到Slave上，所以从Master同步到Slave机器有一定的延迟，当系统很繁忙的时候，延迟问题会更加严重，Slave机器数量的增加也会使这个问题更加严重。

3.7.3 故障恢复

从下线的主服务的所有从服务里面挑选一个从服务，将其转成主服务，选择条件依次为
- 选择优先级靠前的：优先级在redis.conf中默认：replica-priority 100，值越小优先级越高
- 选择偏移量最大的：偏移量是指获得原主机数据最全的
- 选择runid最小的从服务：每个redis实例启动后都会随机生成一个40位的runid
跳转出新的主服务之后，其他服务会向新主服务发送slaveof命令
当已下线的服务重新上线时，sentinel会向其发送slaveof命令，让其成为新主的从

=========================================================