http://diaocow.iteye.com/blog/1946444
在主从复制过程中,我们提到过RDB文件,作为Redis持久化方式之一,RDB把数据库某一时刻的内容,也就是快照,以二进制的方式记录到文件,并且在下次启动的时候可以用来初始化Redis;
RDB最重要的两个过程是rdbSave和rdbLoad,下面我就这两个过程分别叙述;
rdbSave
在具体看rdbSave过程之前,我们先看下RDB文件格式:
我们可以简单思考下,RDB文件协议为什么会那样设计?
1. RDB文件以"REDIS"开头是为了区分普通文件,这样redis在加载的时候,读取前五个字节就可以判断该文件是否为一个合法的RDB文件;
2. 写明RDB文件版本是因为不同版本之间有一定差异性,根据版本号需要保持向下兼容;
3. 以数据库为单位,存入键值对,因为一个redis实例中,可以包含16个数据库,所以一定要标明该键值对属于哪个数据库,否则无法还原到相应位置;
4. 在写入键值对信息时,超时时间是可选的,标明值类型(value-type)是为了在加载的时候知道这是一个string,还是list或者hashtable;
rdbSave过程就是把redis每一个数据库中的键值对按照上面定义的格式写入文件,伪代码:
- def rdbSave(filename):
- # 创建临时文件,用于保存rdb数据
- tempFile = createTempFile()
- rio = rioInitWithFile(tempFile)
- # ----------------------------------
- # 1.保存RDB文件版本
- rdbSaveVersion(rio, "REDIS" + REDIS_RDB_VERSION)
- # 2.保存redis所有数据库中的键值对
- for db in redisServer.dbs:
- # 记录键值对所在数据库
- rdbSaveSelectDB(rio, db.num)
- # 保存该数据库中所有键值对
- for key, val in db.getKeyValuePairs():
- expired_time = getExpiredTime(key)
- rdbSaveKeyValuePair(rio, key, val, expired_time)
- # 3.写入RDB文件结束符
- rdbSaveEOF(rio, REDIS_RDB_OPCODE_EOF)
- # 4.写入校验和
- rdbSaveCkSum(rio)
- # ----------------------------------
- # 确认数据都被flush到磁盘
- fsync()
- rename(tempFile, filename)
- def rdbSaveKeyValuePair(rio, key, val, expired_time):
- if expired_time != -1:
- # 过滤过期键
- if expired_time < now_time:
- return
- rdbSaveMillisecondTime(rio, expired_time)
- # 保存值类型(list? string? hashtable?)
- rdbSaveValueType(rio, val)
- # 保存键
- rdbSaveKey(rio, key)
- # 保存值
- rdbSaveValue(rio, val)
更多细节请看:rdb.c/rdbSave函数
触发rdbSave过程,主要有4种方式:
1. SAVE命令
2. BGSAVE命令
3. master接收到slave发来的sync命令
4. 定时save(配置文件中制定)
第一种情况,Redis保存RDB文件是在主进程中进行,所以在这其间,Redis无法响应客户端请求 (再次强调:Redis是单线程Server) ;第二种情况,Redis fork出一个子进程,然后在子进程中进行rdbSave,因此也就不会阻塞主进程对客户端请求的处理;第三种情况和第四种情况同第二种情况,也是在子进程中进行;
rdbLoad
rdbload过程就比较简单了,它会按照RDB文件协议,把键值对还原到相应的数据库,伪代码:
- def rdbLoad(filename):
- rio = rioInitWithFile(filename);
- # 设置标记:
- # a. 服务器状态:rdb_loading = 1
- # b. 载入时间:loading_start_time = now_time
- # c. 载入大小:loading_total_bytes = filename.size
- startLoading(rio)
- # ------------------------------------------
- # 1.检查该文件是否为RDB文件(即文件开头前5个字符是否为"REDIS")
- if !checkRDBHeader(rio):
- redislog("error, Wrong signature trying to load DB from file")
- return
- # 2.检查当前RDB文件版本是否兼容(向下兼容)
- if !checkRDBVersion(rio):
- redislog("error, Can't handle RDB format version")
- return
- # 3.读取文件内容,加载键值对
- while not end_of_file:
- # 每循环一千次就处理一下客户端请求
- if loops % 1000 == 0:
- processClientRequest()
- key, val, expired_time, dbnum = rdbLoadKeyValuePair()
- # 过滤过期键
- if expired_time != -1 and expired_time <= now_time:
- continue
- redisServer.db[dbnum].dict.add(key,value)
- if expired_time > now_time
- redisServer.db[dbnum].expires.add(key, expired_time)
- loops = loops + 1
- # 4. 校验和
- if (!checkCkSum()): return
- # ------------------------------------------
- # 更新标记:rdb_loading = 0
- stopLoading()
触发rdbLoad过程,主要有两种方式:
1. Redis启动时候的初始化;
2. slave接收到master发来的RDB文件;
总结:
1. 了解RDB文件格式;
2. 了解rdbSave和rdbLoad过程以及触发条件;