Redis的持久化机制

目录

RDB

触发机制

bgsave命令执行流程

RDB的文件处理

RDB的优缺点

AOF

AOF工作流程

AOF缓冲区同步文件策略

AOF重写机制

AOF重写触发机制

AOF重写流程


  在这里我们知道,redis存储的数据是存储在缓存中的,重启服务器数据就不存在了。要想持久化存储我们这里就需要把数据存储在硬盘上。

  Redis支持RDB和AOF两种持久化机制,持久化功能有效地避免因进程退出造成数据丢失问题, 当下次重启时利用之前持久化的文件即可实现数据恢复。


RDB


  RDB持久化是把当前进程数据生成快照保存到硬盘的过程,触发RDB持久化过程分为手动触发和 自动触发。

  RDB会定期把我们Redis内存中的数据,都写入硬盘中,生成一个快照,存储在硬盘中。

当我们重启Redis的时候,Redis就可以根据这个快照恢复到原来的内存中。


触发机制


(1)手动触发分别对应save和bgsave命令:

• save命令:阻塞当前Redis服务器,直到RDB过程完成为止,对于内存比较大的实例造成长时间 阻塞,基本不采用。

• bgsave命令:Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动 结束。阻塞只发生在fork阶段,⼀般时间很短。

(2)自动触发(通过设置Redis的配置文件,让Redis每隔一段时间就触发)

1. 使用save配置。如 "save m n" 表 m 秒内数据集发生了 n 次修改,自动 RDB 持久化。

2. 从节点进行全量复制操作时,主节点自动进行 RDB 持久化,随后将 RDB 文件内容发送给从结点。

3. 执行 shutdown 命令关闭 Redis 时,执行 RDB 持久化。


bgsave命令执行流程


如图:

1. 执行bgsave命令,Redis父进程判断当前进是否存在其他正在执行的子进程,如 RDB/AOF 子进 程,如果存在 bgsave 命令直接返回。

2. 父进程执行fork创建子进程,fork过程中父进程会阻塞,通过info stats命令查看latest_fork_usec 选项,可以获取最近⼀次fork操作的耗时,单位为微秒。

3. 父进程 fork完成后,bgsave命令返回"Background saving started"信息并不再阻塞父进程,可以继续响应其他命令。

4. 子进程创建 RDB 文件,根据父进程内存生成临时快照文件,完成后对原有文件进行原子替换。执行 lastsave 命令可以获取最后⼀次生成RDB的时间,对应info统计的rdb_last_save_time选项。

5. 进程发送信号给父进程表示完成,父进程更新统计信息。


RDB的文件处理


保存:RDB 文件保存再 dir 配置指定的目录(默认/var/lib/redis/)下,文件名通过dbfilename配置(默认dump.rdb)指定。可以通过执行config set dir {newDir} 和 config set dbfilename {newFilename}运行期间动态执行,当下次运行时 RDB 文件会保存到新目录。

压缩:Redis默认采用LZF算法对生成的RDB文件做压缩处理,压缩后的文件远远小于内存大小,默认开启,可以通过参数config set rdbcompression{yes|no}动态修改。

虽然压缩RDB会消耗CPU,但可以大幅降低文件的体积,方便保存到硬盘或通过网络发送到从节点,因此建议开启。


RDB的优缺点


• RDB是⼀个紧凑压缩的⼆进制文件,代表Redis在某个时间点上的数据快照。非常适用于备份,全量复制等场景。比如每6小时执行bgsave备份,并把RDB文件复制到远程机器或者文件系统中 (如hdfs)用于灾备。

• Redis加载RDB恢复数据远远快于AOF的方式。

• RDB方式数据没办法做到实时持久化/秒级持久化。因为bgsave每次运行都要执行fork创建子进 程,属于重量级操作,频繁执行成本过高。

• RDB文件使用特定⼆进制格式保存,Redis版本演进过程中有多个RDB版本,兼容性可能有风险。


AOF


AOF这里是记录用户的每一步的操作,把每一步的操作,都记录在文件中。

当redis重启的是时候,就会读取aof文件的内容,来恢复数据。

那么在这里我们启动redis服务的时候,是使用RDB还是AOF呢?

这里是AOF,AOF开启的时候,RDB就默认关闭了。


开启 AOF 功能需要设置配置:appendonly yes,默认不开启。AOF文件名通过appendfilename配置(默认是appendonly.aof)设置。保存目录同 RDB 持久化方式⼀致,通过dir配置指定。


AOF工作流程


如图:

1. 所有的写入命令会追加到 aof_buf(缓冲区)中。

2. AOF 缓冲区根据对应的策略向硬盘做同步操作。

3. 随着 AOF文件越来越大,需要定期对 AOF了,文件进行重写,达到压缩的目的。

4. 当 Redis 服务器启动时,可以加载 AOF文件进行数据恢复。

AOF过程中为什么需要 aof_buf 这个缓冲区?Redis 使用单线程响应命令,如果每次写 AOF文件都直接同步硬盘,性能从内存的读写变成IO读写,必然会下降。先写入缓冲区可以有效减少IO次数,同时,Redis还可以提供多种缓冲区同步策略,让用户根据自己的需求做出合理的平衡。


AOF缓冲区同步文件策略


如图:

• 配置为always时,每次写入都要同步AOF文件,性能很差,在⼀般的SATA硬盘上,只能支持大约几百TPS写⼊。除非是非常重要的数据,否则不建议配置。

• 配置为no时,由于操作系统同步策略不可控,虽然提高了性能,但数据丢失风险大增,除非数据 重要程度很低,一般不建议配置。

• 配置为everysec,是默认配置,也是推荐配置,兼顾了数据安全性和性能。理论上最多丢失1秒的数据。

系统调用write和fsync说明:

• write操作会触发延迟写(delayed write)机制。Linux在内核提供页缓冲区用来提供硬盘IO性 能。write操作在写入系统缓冲区后立即返回。同步硬盘操作依赖于系统调度机制,例如:缓冲区 页空间写满或达到特定时间周期。同步文件之前,如果此时系统故障宕机,缓冲区内数据将丢失。

• Fsync针对单个文件操作,做强制硬盘同步,fsync将阻塞直到数据写入到硬盘。


AOF重写机制


随着命令不断写入AOF,文件会越来越大,为了解决这个问题,Redis引入AOF重写机制压缩文件体积。AOF文件重写是把Redis进程内的数据转化为写命令同步到新的AOF文件。重写后的AOF为什么可以变小?有如下原因:

• 进程内已超时的数据不再写入文件。

• 旧的AOF中的无效命令,例如del、hdel、srem等重写后将会删除,只需要保留数据的最终版 本。

• 多条写操作合并为⼀条,例如lpush list a、lpush list b、lpush list 从可以合并为lpush list a b c。


AOF重写触发机制


• 手动触发:调用bgrewriteaof命令。

• 自动触发:根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定自动触发时机。

(1)auto-aof-rewrite-min-size:表示触发重写时AOF的最小文件大小,默认为64MB。

(2)auto-aof-rewrite-percentage:代表当前AOF占用大小相比较上次重写时增加的比例。


AOF重写流程


如图:

1. 执行AOF重写请求。如果当前进程正在执行AOF重写,请求不执行。如果当前进程正在执行bgsave操作,重写命令延迟到bgsave完成之后再执行。

2. 父进程执行fork创建子进程。

3. 重写

(1)主进程fork之后,继续响应其他命令。所有修改操作写入AOF缓冲区并根据appendfsync策 略同步到硬盘,保证旧AOF文件机制正确。

b. 子进程只有fork之前的所有内存信息,父进程中需要将fork之后这段时间的修改操作写入 AOF重写缓冲区中。

4. 子进程根据内存快照,将命令合并到新的AOF文件中。

5. 子进程完成重写

(1) 新文件写入后,子进程发送信号给父进程。

(2)父进程把AOF重写缓冲区内临时保存的命令追加到新AOF文件中。

(3)用新AOF文件替换老AOF文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值