redis源码阅读笔记(3)——dict

本文详细解读Redis字典的数据结构、底层实现及关键特性,包括哈希冲突处理、渐进式重哈希、字典的收缩机制以及与Java HashMap的对比分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.高层视角解读
字典, 又称符号表(symbol table)、关联数组(associative array)或者映射(map), 是一种用于保存键值对(key-value pair)的抽象数据结构。
请先看关于字典的一组文章
[url]http://www.redisbook.com/en/latest/toc.html[/url]里面的第4章——字典。
字典的数据结构如图所示。
[img]http://origin.redisbook.com/en/latest/_images/graphviz-6989792733a041b23cdc0b8f126434590c50a4e4.svg[/img]

2.底层代码
代码在dict.h, dict.c这两个文件里。稍微多了一点,1600行代码。
如果读者读过java里的HashMap的源代码的话,可以发现两者的实现思路竟是惊人的相似。

2.1 hashFunction是一个可以由用户自己实现的函数,相当于java里的Object.hashCode方法。

2.2 redis自带一个哈希算法MurmurHash算法。目前的最新版本为 MurmurHash3 , 而 Redis 使用的是 MurmurHash2 。
关于MurmurHash算法的更多信息可以参考该算法的主页: [url]http://code.google.com/p/smhasher/[/url]
在java里有一个库guava也实现了MurmurHash算法
[url]https://code.google.com/p/guava-libraries/wiki/HashingExplained[/url]

2.3 哈希冲突的处理和java一样,采用一个链表来解决冲突,将多个哈希值相同的节点串连在一起。
因为 dictEntry 节点组成的链表没有指向链表表尾的指针, 所以为了速度考虑, 程序总是将新节点添加到链表的表头位置(复杂度为 O(1)), 排在其他已有节点的前面。
java里也是这样。

2.4 rehash和java也是惊人的相似。
负载因子(load factor)>=1时才rehash,这个似乎不太好,java里是>=0.75,因为负载因子达到某个值以后哈希冲突的概率就相当大了。

2.5 渐进式rehash是redis特有的特性,可以防止一次性rehash造成服务器停止工作。但是这个特性也使得代码到处都要考虑当前是否正在进行渐进式rehash,增加了复杂度。

2.6 字典的收缩也是redis特有的特性。
何时收缩?
t_hash.c文件中hashTypeDelete被执行时(HDEL命令)
先执行dictDelete
再执行htNeedsResize判断,如果负载因子小于10%,则调用dictResize缩小哈希表。

2.7 字典里有2个哈希表,使得rehash的时候如果遍历哈希表需要同时遍历2个哈希表。

3. 疑难点解惑
Q:dictEntry **table中**的含义?
A:**在C语言里含义是指向指针的指针,在这里的技巧含义是等价于定义了一个动态数组table中,这个数组里每个元素都是一个指针,每个指针指向一个dictEntry结构体。
table[1]的写法等价于*(table+1),也就是访问数组中的第二个元素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值