4.redis持久化RDB_AOF && 主从复制_redis。主从复制 rdb aof-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_45483328/article/details/123692443

本文深入探讨了Redis的两种持久化机制——RDB和AOF，包括它们的定义、执行流程、优缺点以及配置细节。RDB提供快照备份，适合大规模恢复，而AOF通过记录写操作日志确保数据完整性。此外，文章还介绍了Redis的主从复制机制，分析了其优势、配置方法和常见模式，如读写分离、故障切换等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.Redis持久化

Redis是一个键值对数据库服务器，服务器中通常包含任意个非空数据库，而每个非空数据库又可以包含任意个键值对，我们将服务器中的非空数据库以及它们的键值对统称为数据库状态。

因为Redis是内存数据库，他将自己的数据库状态存储在内存里面，所有如果不想办法将存储在内存中的数据库状态保存到磁盘里面，一旦服务器进程退出，服务器中的数据库状态也会消失不见。

为了解决这个问题，redis提供了两种持久化形式：

RDB（Redis DataBase）
AOF（Append Of File）

1.1 RDB(Redis DataBase)

1.1.1 定义

RDB是Redis提供的一种持久化功能，该功能可以将某个节点上的数据库状态保存到磁盘里，避免数据意外丢失。而RDB文件是是一个经过压缩的二进制文件，通过该文件可以还原生成RDB文件时的数据库状态。

在这里插入图片描述

1.1.2 备份是如何执行的

SAVE

阻塞Redis服务器进程，直到RDB文件创建完成，在服务器阻塞期间，服务器不能处理任何命令请求。（不建议日常使用）
BGSAVE

Redis会单独创建（fork）一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。整个过程中，主进程是不进行任何IO操作的，这就确保了极高的性能如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那RDB方式要比AOF方式更加的高效。

RDB的缺点是最后一次持久化后的数据可能丢失

l Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据（变量、环境变量、程序计数器等）数值都和原进程一致，但是是一个全新的进程，并作为原进程的子进程

在Linux程序中，fork()会产生一个和父进程完全相同的子进程，但子进程在此后多会exec系统调用，出于效率考虑，Linux中引入了“写时复制技术”

一般情况父进程和子进程会共用同一段物理内存，只有进程空间的各段的内容要发生变化时，才会将父进程的内容复制一份给子进程。

1.1.3 RDB持久化流程

在这里插入图片描述

1.1.4 dump.rbd

在redis.conf中配置文件名称，默认生成的rdb文件为dump.rdb

在这里插入图片描述

默认保存路径为Redis启动时命令行所在的目录下

在这里插入图片描述

1.1.5 自动间隔性保存

SAVE命令由服务器进程执行保存工作，BGSAVE命令则由子进程执行保存工作，所以SAVE命令会阻塞服务器，而BGSAVE命令则不会。

因为BGSAVE命令可以在不阻塞服务器进程的情况下执行，所以Redis允许用户通过设置服务器配置的save选项，让服务器每隔–段时间自动执行–次BGSAVE命令。

用户可以通过save选项设置多个保存条件,但只要其中任意-一个条件被满足，服务器就会执行BGSAVE命令。

举个例子，如果我们向服务器提供以下配置:

save 900 1
save 300 10
save 60 10000

那么只要满足以下三个条件中的任意一个， BGSAVE命令就会被执行:

服务器在900秒之内，对数据库进行了至少1次修改。
服务器在300秒之内，对数据库进行了至少10次修改。
服务器在60秒之内，对数据库进行了至少10000次修改。

对于存储到磁盘中的数据，可以设置是否进行压缩存储。如果是的话，redis会采用LZF算法进行压缩。

在这里插入图片描述

1.1.6 总结

优势
- 适合大规模的数据恢复
- 对数据完整性和一致性要求不高更适合使用
- 节省磁盘空间
- 恢复速度快
劣势
- Fork的时候，内存中的数据被克隆了一份，大致2倍的膨胀性需要考虑
- 虽然Redis在fork时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
- 在备份周期在一定间隔时间做一次备份，所以如果Redis意外down掉的话，就会丢失最后一次快照后的所有修改。

1.2 AOF（Append Only File）

除了RDB持久化功能之外，Redis 还提供了AOF ( Append Only File) 持久化功能。与RDB持久化通过保存数据库中的键值对来记录数据库状态不同，AOF持久化是通过保存
Redis服务器所执行的写命令来记录数据库状态的。

在这里插入图片描述

1.2.1 定义

以日志的形式来记录每个写操作（增量保存），将Redis执行过的所有写指令记录下来(读操作不记录)， 只许追加文件但不可以改写文件，redis启动之初会读取该文件重新构建数据，换言之，redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作

1.2.2 持久化流程

AOF的持久化功能的实现分为追加（append）、文件写入、文件同步（sync）三个步骤。

1.2.2.1 命令追加

当AOF功能打开时，服务器在执行完一个写命令后，会以协议格式将被执行的写命令追加到服务器状态aof_buf缓冲区的末尾。

1.2.2.2 写入和同步

Redis的服务器进程就是一个事件循环( loop),这个循环中的文件事件负责接收客户端的命令请求，以及向客户端发送命令回复。而时间事件负责执行定时运行的函数。
因为服务器在处理文件事件时可能会执行写命令，使得一些内容被追加到aof_ buf 缓冲区里面，所以在服务器每次结束一个事件循环之前，它都会调用flushAppend0n1yFile函数，考虑是否需要将aof_ buf 缓冲区中的内容写人和保存到AOF文件里面，这个过程可以用以下伪代码表示:

在这里插入图片描述

flushAppendOnlyFile函数的行为由服务器的配置的appendfsync选项值决定。

在这里插入图片描述

1.2.2.3 数据恢复

Redis服务重启时，会重新load加载AOF文件中的写操作达到数据恢复的目的

在这里插入图片描述

1.2.3 配置

AOF一般默认不开启，可以在redis.conf中配置文件名称，默认为 appendonly.aof

AOF文件的保存路径，同RDB的路径一致

AOF和RDB同时开启，系统默认取AOF的数据（数据不会存在丢失）

1.2.4 AOF启动/修复/恢复

AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样，都是拷贝备份文件，需要恢复时再拷贝到Redis工作目录下，启动系统即加载。

正常恢复
- 修改默认的appendonly no，改为yes
- 将有数据的aof文件复制一份保存到对应目录(查看目录：config get dir)
- 恢复：重启redis然后重新加载
异常恢复
- 修改默认的appendonly no，改为yes
- 如遇到AOF文件损坏**，通过/usr/local/bin/redis-check-aof–fix appendonly.aof进行恢复
- 备份被写坏的AOF文件
- 恢复：重启redis，然后重新加载

1.2.5 Rewrite压缩

是什么：

AOF采用文件追加方式，文件会越来越大为避免出现此种情况，新增了重写机制, 当AOF文件的大小超过所设定的阈值时，Redis就会启动AOF文件的内容压缩，只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof
重写原理，如何实现重写

AOF文件持续增长而过大时，会fork出一条新进程来将文件重写(也是先写临时文件最后再rename)，redis4.0版本后的重写，是指上就是把rdb 的快照，以二级制的形式附在新的aof头部，作为已有的历史数据，替换掉原来的流水账操作。

no-appendfsync-on-rewrite：

如果 no-appendfsync-on-rewrite=yes ,不写入aof文件只写入缓存，用户请求不会阻塞，但是在这段时间如果宕机会丢失这段时间的缓存数据。（降低数据安全性，提高性能）
如果 no-appendfsync-on-rewrite=no, 还是会把数据往磁盘里刷，但是遇到重写操作，可能会发生阻塞。（数据安全，但是性能降低）

触发机制，何时重写

Redis会记录上次重写时的AOF大小，默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发重写.虽然可以节约大量磁盘空间，减少恢复时间。但是每次重写还是有一定的负担的，因此设定Redis要满足一定条件才会进行重写。

auto-aof-rewrite-percentage：设置重写的基准值，文件达到100%时开始重写（文件是原来重写后文件的2倍时触发）

auto-aof-rewrite-min-size：设置重写的基准值，最小文件64MB。达到这个值开始重写。例如：文件达到70MB开始重写，降到50MB，下次什么时候开始重写？100MB

系统载入时或者上次重写完毕时，Redis会记录此时AOF大小，设为base_size,如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)的情况下，Redis会对AOF进行重写。

重写流程

（1）bgrewriteaof触发重写，判断是否当前有bgsave或bgrewriteaof在运行，如果有，则等待该命令结束后再继续执行。

（2）主进程fork出子进程执行重写操作，保证主进程不会阻塞。

（3）子进程遍历redis内存中数据到临时文件，客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。

（4）1).子进程写完新的AOF文件后，向主进程发信号，父进程更新统计信息。2).主进程把aof_rewrite_buf中的数据写入到新的AOF文件。

（5）使用新的AOF文件覆盖旧的AOF文件，完成AOF重写。

在这里插入图片描述

1.2.6 总结

优势
- 备份机制更稳健，丢失数据概率更低。
- 可读的日志文本，通过操作AOF稳健，可以处理误操作。
劣势
- 比起RDB占用更多的磁盘空间。
- 恢复备份速度要慢。
- 每次读写都同步的话，有一定的性能压力。
- 存在个别Bug，造成恢复不能。

1.3 总结

1.3.1 用哪个好

官方推荐两个都启用。

如果对数据不敏感，可以选单独用RDB。

不建议单独用 AOF，因为可能会出现Bug。

如果只是做纯内存缓存，可以都不用。

1.3.2 官网建议

RDB持久化方式能够在指定的时间间隔能对你的数据进行快照存储
AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以redis协议追加保存每次写的操作到文件末尾.
Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大
只做缓存：如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式.
同时开启两种持久化方式

在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据, 因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整.
RDB的数据不实时，同时使用两者时服务器重启也只会找AOF文件。那要不要只使用AOF呢？建议不要，因为RDB更适合用于备份数据库(AOF在不断变化不好备份)，快速重启，而且不会有AOF可能潜在的bug，留着作为一个万一的手段。
性能建议

因为RDB文件只用作后备用途，建议只在Slave上持久化RDB文件，而且只要15分钟备份一次就够了，只保留save 900 1这条规则。如果使用AOF，好处是在最恶劣情况下也只会丢失不超过两秒数据，启动脚本较简单只load自己的AOF文件就可以了。代价,一是带来了持续的IO，二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可，应该尽量减少AOF rewrite的频率，AOF重写的基础大小默认值64M太小了，可以设到5G以上。默认超过原大小100%大小时重写可以改到适当的数值。

2.主从复制

2.1 什么是主从复制

redis支持一个服务器去复制另一个服务器的数据，我们称被复制服务器为主服务器，复制服务器为从服务器。

即主机数据更新后根据配置和策略，自动同步到备机的master/slaver机制，Master以写为主，Slave以读为主

2.2 优点

读写分离，性能扩展
容灾快速恢复

在这里插入图片描述

2.3 配置主从复制

在这里插入图片描述

复制redis.conf到myredis文件夹下

在这里插入图片描述

配置一主多从，创建三个配置文件
- redis6779.conf
- redis6779.conf
- redis6779.conf

在这里插入图片描述

文件内容为

include /myredis/redis.conf
pidfile /var/run/redis_6379.pid
port 6379
dbfilename dump6379.rdb

查看系统进程，三台服务器已经启动

在这里插入图片描述

查看三台主机运行情况

info replication

在这里插入图片描述

发现他们每个都是主机

slabeof

配从(库)不配主(库)

slaveof <ip> <port> //成为某个实例的从服务器

在这里插入图片描述

注意点

在主机上写，在从机上可以读取数据，但是从机上不能写数据

在这里插入图片描述

主机挂掉，重启就行，一切如初
从机重启需要重设主机：slaveof 127.0.0.1 6379

2.4 复制原理

Slave启动成功连接到master后会发送一个sync命令
Master接到命令启动后台的存盘进程，同时收集所有接收到的用于修改数据集命令，在后台进程执行完毕之后，master将传送整个数据文件到slave,以完成一次完全同步
全量复制：而slave服务在接收到数据库文件数据后，将其存盘并加载到内存中。
增量复制：Master继续将新的所有收集到的修改命令依次传给slave,完成同步（类似于TCP连接中的序列号）
但是只要是重新连接master,一次完全同步（全量复制)将被自动执行

在这里插入图片描述

2.5 常用模式

2.5.1 薪火相传

原本一台主服务器只有2台从服务器连接，现在变成了20个从服务器，服务器是根本扛不住的，那么就可以设置小组长，让一部分的压力让小组长来承受，向糖葫芦一样，一个个串起来。

上一个Slave可以是下一个slave的Master，Slave同样可以接收其他 slaves的连接和同步请求，那么该slave作为了链条中下一个的master, 可以有效减轻master的写压力,去中心化降低风险。

用 slaveof 中途变更转向:会清除之前的数据，重新建立拷贝最新的

风险是一旦某个slave宕机，后面的slave都没法备份。主机挂了，从机还是从机，无法写数据了

在这里插入图片描述

2.5.2 反客为主

当一个master宕机后，后面的slave可以立刻升为master，其后面的slave不用做任何修改。

用 slaveof no one 将从机变为主机。

在这里插入图片描述

2.5.3 哨兵模式

反客为主在实际的开发环境中是不适用的，因为维护人员根本不知道服务器什么时候发生宕机，所有引出了哨兵模式

反客为主的自动版，能够后台监控主机是否故障，如果故障了根据投票数自动将从库转换为主库

在这里插入图片描述

配置哨兵过程
1.自定义的/myredis目录下新建sentinel.conf文件
2.sentinel monitor mymaster 127.0.0.1 6379 1
其中mymaster为监控对象起的服务器名称， 1 为至少有多少个哨兵同意迁移的数量。
3.redis-sentinel  /myredis/sentinel.conf 
启动哨兵。当master异常宕机后，会从slave中根据策略选择一个slave成为新的master
且原先的master将会成为新master的slave

在这里插入图片描述

如果主机挂了，那么就会根据下面规则找一个新的主子，旧主子恢复连接后，也得是一代臣子。

在这里插入图片描述

优先级在redis.conf中默认：slave-priority 100，值越小优先级越高

偏移量是指获得原主机数据最全的

每个redis实例启动后都会随机生成一个40位的runid

2.6 Jedis中配置

private static JedisSentinelPool jedisSentinelPool=null;

public static  Jedis getJedisFromSentinel(){
    if(jedisSentinelPool==null){
        Set<String> sentinelSet=new HashSet<>();
        sentinelSet.add("192.168.11.103:26379");

        JedisPoolConfig jedisPoolConfig =new JedisPoolConfig();
        jedisPoolConfig.setMaxTotal(10); //最大可用连接数
        jedisPoolConfig.setMaxIdle(5); //最大闲置连接数
        jedisPoolConfig.setMinIdle(5); //最小闲置连接数
        jedisPoolConfig.setBlockWhenExhausted(true); //连接耗尽是否等待
        jedisPoolConfig.setMaxWaitMillis(2000); //等待时间
        jedisPoolConfig.setTestOnBorrow(true); //取连接的时候进行一下测试 ping pong

        jedisSentinelPool=new JedisSentinelPool("mymaster",sentinelSet,jedisPoolConfig);
        return jedisSentinelPool.getResource();
    }else{
        return jedisSentinelPool.getResource();
    }
}