《Redis设计与实现》第四章总结：字典

最新推荐文章于 2024-08-19 15:18:54 发布

木棉上的光

最新推荐文章于 2024-08-19 15:18:54 发布

阅读量262

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Redis 文章标签： Redis设计与实现

本文链接：https://blog.youkuaiyun.com/qq_41594698/article/details/94011566

Redis 专栏收录该内容

35 篇文章

订阅专栏

本文详细介绍了Redis中字典的设计与实现，字典作为底层数据结构，用于保存键值对。内容包括哈希表的结构、哈希算法、键冲突的解决方法以及渐进式rehash的机制，深入解析了Redis如何高效地管理和操作数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

3.字典

用于保存键值对的抽象数据结构，即Java的map

C语言没有实现字典，因此Redis自己实现了一套

Redis的数据库就是使用字典来作为底层实现的，crud操作也是构建在对字典的操作之上的
例子：
在这里插入图片描述
哈希键的底层实现之一也是字典，当一个哈希键包含的键值对比较多，或键值对中的元素都是比较长的字符串时，就是使用字典
例子：website包含10086个键值对，键为数据库名，值为对应的主页网址

3.1 实现

字典底层实现为哈希表，一个哈希表里面可以有多个哈希节点，每个哈希节点保存了一个键值对

3.1.1 哈希表

dict.h/dictht：
在这里插入图片描述
table是一个数组，数组元素为指向dict.h/dictEntry结构的指针，每个dictEntry结构保存着一个键值对；

空哈希表示例：
在这里插入图片描述

3.1.2 哈希表节点

即上述的dict.h/dictEntry：
在这里插入图片描述
v保存着值，使用union，代表值可以为一个指针、uint64_t整数或int64_t整数；相同哈希值的键值对则使用next相连

例子：两个索引值相同的键k1、k0相连
在这里插入图片描述

3.1.3 字典具体实现

dict.h/dict：
在这里插入图片描述
type和privdata是为创建多态字典而设置的，用来针对不同类型的键值对；type为dictType，保存了一簇用于操作特定类型键值对的函数，privdata则保存了需要传给那些类型特定函数的可选参数：

ht[1]一般只会在ht[0]进行rehash时使用；rehashidx则记录了rehash目前的进度，如果目前没有在进行的rehash，则值为-1

例子：一个没有进行rehash的字典
在这里插入图片描述

3.2 哈希算法

插入键值对：先根据键值对的键计算出哈希值和索引值，然后根据索引值，将此键值对放到哈希表数组的指定索引上面

Redis计算哈希值和索引值的方法如下：
在这里插入图片描述
例子：
如图的一个空字典：

如果要插入一个键值对为k0、v0的哈希表节点到字典中，且根据计算，得出哈希值为8，索引值为0，则如图：

当字典被用作数据库的底层实现，或者哈希键的底层实现时，使用MurmurHash2算法来计算哈希值

此算法优点：即使输入的键是有规律的，仍能给出一个很好的随机分布性，并且计算速度快

3.3 解决键冲突

含义：当有两个或两个以上的键被分配到了同一个索引上时，称之为发生了冲突

Redis的哈希表使用链地址法来解决键冲突，即next指针的作用，多个相同索引值的哈希表节点可以用next指针构成一个单向链表

因为没有设计尾指针，所以这里采用头插法，提高插入速度为O(1)

3.4 rehash

含义：为了让哈希表的负载因子维持在一个合理的范围之内，当哈希表保存的键值对数量太多或者太多时，对哈希表的大小进行相应的扩展或者收缩

负载因子的计算公式：
在这里插入图片描述
扩展和收缩哈希表的工作可以通过rehash来完成，具体步骤如下：

如下情况进行扩展：

BGSAVE和BGREWRITEAOF影响扩展的原因：扩展即修改操作，触发了服务器进程的写时复制

如下情况进行收缩：

3.5 渐进式rehash

含义：扩展或收缩哈希表时，需要将ht[0]里面的所有键值对rehash到ht[1]里面，但是这个动作并不是一次性、集中式地完成的，而是分多次、渐进式地完成的。好处是当键值对有上百万个的时候，庞大的计算量可以被分摊开来；
起主要作用的是dict的rehashidx字段；采用分而治之的思想，将rehash键值对所需的计算工作均摊到对字典的每个crud操作上，从而避免了集中式rehash而带来的庞大计算量

步骤：
在这里插入图片描述
删除、查找、更新操作会在两个表上进行，先ht[0]后ht[1]；插入则在ht[1]上进行