3.字典
用于保存键值对的抽象数据结构,即Java的map
C语言没有实现字典,因此Redis自己实现了一套
Redis的数据库就是使用字典来作为底层实现的,crud操作也是构建在对字典的操作之上的
例子:
哈希键的底层实现之一也是字典,当一个哈希键包含的键值对比较多,或键值对中的元素都是比较长的字符串时,就是使用字典
例子:website包含10086个键值对,键为数据库名,值为对应的主页网址
3.1 实现
字典底层实现为哈希表,一个哈希表里面可以有多个哈希节点,每个哈希节点保存了一个键值对
3.1.1 哈希表
dict.h/dictht:
table是一个数组,数组元素为指向dict.h/dictEntry结构的指针,每个dictEntry结构保存着一个键值对;
空哈希表示例:
3.1.2 哈希表节点
即上述的dict.h/dictEntry:
v保存着值,使用union,代表值可以为一个指针、uint64_t整数或int64_t整数;相同哈希值的键值对则使用next相连
例子:两个索引值相同的键k1、k0相连
3.1.3 字典具体实现
dict.h/dict:
type和privdata是为创建多态字典而设置的,用来针对不同类型的键值对;type为dictType,保存了一簇用于操作特定类型键值对的函数,privdata则保存了需要传给那些类型特定函数的可选参数:
ht[1]一般只会在ht[0]进行rehash时使用;rehashidx则记录了rehash目前的进度,如果目前没有在进行的rehash,则值为-1
例子:一个没有进行rehash的字典
3.2 哈希算法
插入键值对:先根据键值对的键计算出哈希值和索引值,然后根据索引值,将此键值对放到哈希表数组的指定索引上面
Redis计算哈希值和索引值的方法如下:
例子:
如图的一个空字典:
如果要插入一个键值对为k0、v0的哈希表节点到字典中,且根据计算,得出哈希值为8,索引值为0,则如图:
当字典被用作数据库的底层实现,或者哈希键的底层实现时,使用MurmurHash2算法来计算哈希值
此算法优点:即使输入的键是有规律的,仍能给出一个很好的随机分布性,并且计算速度快
3.3 解决键冲突
含义:当有两个或两个以上的键被分配到了同一个索引上时,称之为发生了冲突
Redis的哈希表使用链地址法来解决键冲突,即next指针的作用,多个相同索引值的哈希表节点可以用next指针构成一个单向链表
因为没有设计尾指针,所以这里采用头插法,提高插入速度为O(1)
3.4 rehash
含义:为了让哈希表的负载因子维持在一个合理的范围之内,当哈希表保存的键值对数量太多或者太多时,对哈希表的大小进行相应的扩展或者收缩
负载因子的计算公式:
扩展和收缩哈希表的工作可以通过rehash来完成,具体步骤如下:
如下情况进行扩展:
BGSAVE和BGREWRITEAOF影响扩展的原因:扩展即修改操作,触发了服务器进程的写时复制
如下情况进行收缩:
3.5 渐进式rehash
含义:扩展或收缩哈希表时,需要将ht[0]里面的所有键值对rehash到ht[1]里面,但是这个动作并不是一次性、集中式地完成的,而是分多次、渐进式地完成的。好处是当键值对有上百万个的时候,庞大的计算量可以被分摊开来;
起主要作用的是dict的rehashidx字段;采用分而治之的思想,将rehash键值对所需的计算工作均摊到对字典的每个crud操作上,从而避免了集中式rehash而带来的庞大计算量
步骤:
删除、查找、更新操作会在两个表上进行,先ht[0]后ht[1];插入则在ht[1]上进行