Redis 哈希表 VS Java HaspMap , 哪家强?

本文详细介绍了Redis字典的rehash过程,以及与Java HashMap的异同。Redis字典使用渐进式rehash策略,避免了一次性迁移大量数据的影响,而在键冲突时采用链表头插入。同时,文章对比了Redis与Java HashMap在哈希冲突解决和扩容策略上的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

哈喽,大家好,我是指北君。

之前给大家介绍了Redis的基本数据结构,本篇介绍一下Redis 字典的rehash 过程。并对比Java中HashMap的一些异同。

1.前言

我们回顾一下之前讲到的Redis的字典结构,示意图如下:

Redis的字典本质上来说也是数组+链表的数据结构,这与Java中HashMap的数据结构很类似啦。

由上述结构示意图也能看出,字典dict中维护了一个ht数组,而且只有两个元素,这两个元素是其扩容的关键点,这个我们后面会讲到。

Redis中的哈希对象在以下条件时,使用ziplist编码。

  • 哈希对象保存的所有键值的字符串长度都小于64字节。
  • 哈希对象保存的键值对数量小于512个。

否则哈希对象会使用hashtable编码, 而hashtable则时使用了字典作为底层实现的。

如下redis 哈希对象编码由ziplist 变成hashtable。

2.增加元素与键冲突

当不同的键值经过哈希算法与散列算法之后被分配到了同一个哈希表数组的同一个索引上,那么这之后就会有键冲突。

Redis 哈希表解决哈希冲突同样是使用了链表地址法。使用哈希节点的next指针来链接同一个哈希表数组索引上的元素。不过Redis会将新添加的哈希节点加入到链表的表头位置。

如下所示:如果程序要将键值对 (k2 , v2 ) 添加到如下的哈希表中,而且计算的书的索引为1,那么和 (k1 v1) 将产生冲突。解决冲突时,会将两个节点使用next指针链接起来。而且会将新节点添加到链表表头的位置。

哈希表1

链表解决hash冲突之后的哈希表

3.rehash 扩容过程

哈希表不断的增加元素,其元素数量达到一定的比例之后,程序会对哈希表进行相应的扩展。通过执行rehash (重新散列)操作完成操作。其步骤如下:

  • 执行扩展操作时会将字典中的ht[1] 哈希表大小设置成第一个大于等于ht[0] 的ht[0].used * 2的 2^n (2的n次幂)。
  • 将保存早ht[0] 中的所有的键值对 rehash到ht[1] 上, rehash过程中会重新计算哈希值和索引值。
  • 当ht[0]中所有的键值对都迁移到ht[1]上时,释放ht[0], 并将ht[1] 设置成 ht[0], 并在ht[1]上建一个空的哈希表。

将下图中的字典做rehash操作:

  1. ht[0].used 是4,4*2 = 8 ,2的3次方8 是第一个大于4的 2的n次幂。即程序会将ht[1] 的大小设置成8 ,并分配空间,结构示意如下:

  1. 将ht[0] 上的几个键值对全部都rehash到ht[1] 上面,如下图:

  1. 释放ht[0],并将ht[1] 设置成 ht[0] , 然后为ht[1]分配一个空白的哈希表 如下图:

以上是一个rehash的过程示意。

4.渐进式rehash

上面讲的是一个rehash的理论过程,redis实际操作时并不会一次将所有的迁移一次性完成。

如果键值对数量非常庞大,那么迁移过程必然需要花费一点时间。由此可知,服务器也不可能一次将所有的键值对迁移,需要分多次,逐渐将ht[0] 里面的键值对迁移到ht[1]中。

其步骤如下:

  • 首先会给ht[1]分配内存空间,此时redis字典拥有两个哈希表。
  • 字典中维护一个rehashidx的计数器,将其值设置为0,表示rehash工作开始。
  • 在rehash期间,程序依然可以进行增删改查的操作,除此之外还会顺带将ht[0]上 rehashidx索引上所有的键值对rehash到ht[1]上,rehash的工作完成后会将rehashidx的值加1。
  • 随着字典的操作,ht[0]上的所有键值全部都rehash到ht[1]上时,程序会将rehashidx的值设为-1 ,表示rehash操作已经完成。

在渐进式rehash的过程中,redis字典依然是可以进行增删改查的操作, 其中增加元素的时候会将元素直接保存到ht[1]中, 而删除,查找,更新的操作会在两个哈希表中进行, 查找时会现在ht[0]中进行查找,然后会在ht[1]中进行查找。以上措施可以宝成ht[0]中的元素只会减少,最终变成空表。

总结

  • Redis 字典使用的时哈希表作为底层,并且每个字典维护了两个哈希表,ht[0] 时主要使用的哈希表,而ht[1] 是在rehash过程是才会使用到的表。
  • 哈希表的底层同样是使用了数组 + 链表的结构, 与Java 中HashMap 相似,只不过Java8 以后增加了红黑树,在特定情况下会替换链表。
  • 哈希表增加元素遇到哈希冲突是会将新添加的元素放到链表头,而Java HashMap会将其放到链表尾,
  • 扩容过程中redis的字典是渐进式扩容,扩容期间还是可以进行操作的,而Java的HashMap扩容需要一次性完成。
Redis 中的哈希表Hash Table)是其底层实现字典(Dict)的核心数据结构之一,用于高效地存储检索键值对。Redis哈希表设计类似于 Java 中的 `HashMap`,但具有独特的实现细节以适应其高性能需求[^2]。 ### 哈希表的结构设计 Redis 使用 `dictht` 结构体来表示一个哈希表,其中包含以下关键字段: - **table**:这是一个指针数组,每个元素指向一个 `dictEntry` 结构,表示哈希表中的一个节点。 - **size**:表示哈希表的容量,即 `table` 数组的大小。 - **sizemask**:用于计算键的哈希值对应的索引值,其值为 `size - 1`。 - **used**:记录当前哈希表中已有的节点数量。 ```c typedef struct dictht { dictEntry **table; unsigned long size; unsigned long sizemask; unsigned long used; } dictht; ``` ### 哈希节点的设计 每个哈希表节点由 `dictEntry` 结构表示,它保存着一个键值对(key-value pair),并使用链表结构解决哈希冲突问题: ```c typedef struct dictEntry { void *key; // 键 union { // 值可以是指针、整数或无符号整数 void *val; uint64_t u64; int64_t s64; double d; } v; struct dictEntry *next; // 指向下一个节点的指针,用于链表处理冲突 } dictEntry; ``` 当多个键经过哈希函数计算后映射到同一个索引位置时,这些键值对会以链表的形式存储在该索引下,从而避免冲突导致的数据丢失。 ### 字典结构与双哈希表机制 为了支持高效的 rehash 操作,Redis 在 `dict` 结构体中定义了两个哈希表 `ht[2]`。通常情况下,数据只写入第一个哈希表(`ht[0]`),而第二个哈希表(`ht[1]`)在 rehash 过程中被动态分配填充。 ```c typedef struct dict { dictht ht[2]; // 两个哈希表,交替使用 int rehashidx; // rehash 状态标识,-1 表示未进行 rehash int16_t pauselistener; ... } dict; ``` 这种双哈希表的设计使得 Redis 能够在不阻塞主线程的情况下完成哈希表的扩容或缩容操作。 ### Rehash 机制 RehashRedis 哈希表自动调整大小的过程。当哈希表中的元素数量接近或超过其容量时,Redis 会触发 rehash 操作以提高查找效率。具体步骤如下: 1. 创建一个新的更大的哈希表(通常是原表大小的两倍),并将该新表作为 `ht[1]`。 2. 将 `rehashidx` 设置为 0,表示开始 rehash。 3. 每次执行插入、删除或查找操作时,Redis 会将一部分 `ht[0]` 中的元素迁移到 `ht[1]` 中,逐步完成迁移。 4. 当所有元素迁移完成后,释放 `ht[0]` 并将其替换为 `ht[1]`,然后重置 `ht[1]`,最后将 `rehashidx` 设为 -1,表示 rehash 完成。 这种方式确保了即使在高并发环境下,Redis 也能平滑地扩展哈希表而不影响性能。 ### 使用方法 Redis 提供了丰富的命令来操作哈希表类型的数据结构,例如: - **HSET key field value**:设置哈希表 `key` 中 `field` 对应的值为 `value`。 - **HGET key field**:获取哈希表 `key` 中 `field` 对应的值。 - **HDEL key field**:删除哈希表 `key` 中的一个或多个 `field`。 - **HLEN key**:返回哈希表 `key` 中字段的数量。 - **HKEYS key**:返回哈希表 `key` 中所有的字段名。 - **HVALS key**:返回哈希表 `key` 中所有的字段值。 - **HGETALL key**:返回哈希表 `key` 中所有的字段及其对应的值。 通过这些命令,用户可以方便地对 Redis 中的哈希表进行增删改查等操作。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值