redis中的hash实现

本文详细探讨了hashtable数据结构的封装方式,包括其内部组件如hashtable、dict、dictEntry等,并阐述了如何创建、查找、添加、扩容以及rehash操作的实现原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

典型的数据结构

  • hashtable的一个封装


typedef struct dict {
    dictType *type; //函数集合
    void *privdata; 
    dictht ht[2];  //真正的hashtable,有两个的原因是在扩容以及rehash的时候使用
    int rehashidx; //是否处于rehash状态,-1是不属于
    int iterators; /* number of iterators currently running */
} dict;


  • 真正的hashtable


typedef struct dictht {
    dictEntry **table; // slot数组指针,slot中存放元素
    unsigned long size; //元素容量(实际就是hash中 slot的个数)
    unsigned long sizemask;(实际就是元素hash取模的基数(size-1))
    unsigned long used; //已经存储的元素个数
} dictht;


  • hashtable绑定的函数


typedef struct dictType {
    unsigned int (*hashFunction)(const void *key);
    void *(*keyDup)(void *privdata, const void *key);
    void *(*valDup)(void *privdata, const void *obj);
    int (*keyCompare)(void *privdata, const void *key1, const void *key2);
    void (*keyDestructor)(void *privdata, void *key);
    void (*valDestructor)(void *privdata, void *obj);
} dictType;


  • 元素(链表结构,包含key和value以及下个元素的指针)


typedef struct dictEntry {

    void *key;
    void *val;
    struct dictEntry *next;
} dictEntry;


见图

典型场景

  • 创建 (dict.c:dictCreate)
    • 分配内存
    • 设置绑定函数(dict->type)
  • 添加(dict:dictAdd)
    • 如果此时处于rehash状态,那么执行rehash(通常一步,下面会讲)
    • 通过dict:_dictKeyIndex返回slot索引(如果处于rehash状态,也会去遍历ht[1]),如果key存在则返回-1
      • 此时会通过(dict:_dictExpandIfNeeded)来看是否有必要扩容,下面会重点谈
    • 仍然检查是否rehash状态,如果不是则将选择ht[0]作为插入的table,否则选择ht[1]
    • 上面的步骤已经确定插入哪个table以及哪个slot,此时开始给entry分配内存
    • 将新entry插入到链表的表头
  • 查找(dict.c:dictFind)
    • 如果ht[0]为空,则返回null
    • 如果此时处于rehash状态,那么执行rehash(通常一步)
    • 计算key的hash值
    • 根据hash值确定slot(默认去找ht[0]的slot)
    • 遍历slot链表去查找相应的key
    • 在ht[0]中找不到key,如果此时处于rehash状态,那么再去查找ht[1]
  • 扩容的整体过程
    • 扩容(dict:_dictExpandIfNeeded)
      • 如果此时处于rehash状态,返回
      • 如果ht[0]为空,则扩展到初始尺寸(#define DICT_HT_INITIAL_SIZE     4)(slot数目为size-1)
      • 如果【ht[0]的元素个数超过初始尺寸】 && (【允许扩容(默认允许)】 || 【使用比例(容纳的元素个数/初始尺寸)大于阀值(5)】),开始扩容,初始尺寸扩大为原来的2倍
        • 此时仅仅是设置rehash标识(见dict属性rehashidx),并不迁移数据
        • rehashidx为-1表示不处于rehash状态,当处于rehash状态(rehashidx>-1)时rehashidx表示ht[1]待处理的slot索引(开始时是0)
        • 另外在事件循环中,每次处理时间函数时调用redis.c:serverCron->redis.c:tryResizeHashTables看是否需要扩容,扩容的标准是used>10*size
      • 在添加(dict:dictAdd)过程中会触发扩容操作
    • rehash( dict:dictRehash)
      • 有了上面这个rehash标识,就可以进行rehash(迁移数据)
      • 迁移数据是指从ht[0]-->ht[1]
      • 迁移数据也并不是一次就全部完成,默认情况每次迁移一个或者一部分slot
        • 在访问过程中是一次迁移一个slot
        • 在事件循环中,每次处理时间函数是调用redis.c:serverCron->redis.c:incrementallyRehash来继续rehash,最多迁移100个slot,如果超过1ms,就停止迁移
      • 等ht[0]全部迁移到ht[1],就切换ht[1]到ht[0]
      • 在添加(dict:dictAdd)、查找(dict.c:dictFind)过程中都会触发entry迁移
### Redis Hash 数据结构的使用方法 Redis 的 `Hash` 数据结构是一种键值对集合,适用于存储对象及其属性。以下是关于如何使用 Redis Hash 数据结构的具体说明以及示例。 #### 特点概述 - **节省空间**:对于小型对象,Redis 会对 Hash 进行内部优化以减少内存占用[^1]。 - **高效操作**:可以单独操作 Hash 中的字段,无需序列化整个对象[^1]。 - **快速访问**:支持通过字段名快速获取或设置对应的值,适合高频读写的场景。 #### Java 实现示例 下面是一个基于 Jedis 客户端库的操作示例: ```java import redis.clients.jedis.Jedis; import java.util.HashMap; import java.util.Map; public class RedisHashExample { public static void main(String[] args) { // 创建连接到本地 Redis 服务器的对象 Jedis jedis = new Jedis("localhost"); // 设置用户信息 String userKey = "user:1001"; Map<String, String> userInfo = new HashMap<>(); userInfo.put("name", "John Doe"); userInfo.put("email", "john.doe@example.com"); jedis.hmset(userKey, userInfo); // 获取用户信息 Map<String, String> retrievedUserInfo = jedis.hgetAll(userKey); System.out.println("Retrieved User Info: " + retrievedUserInfo); // 更新单个字段 jedis.hset(userKey, "phone", "555-1234"); String phone = jedis.hget(userKey, "phone"); System.out.println("Updated Phone Number: " + phone); // 删除某个字段 jedis.hdel(userKey, "email"); boolean emailExists = !jedis.hexists(userKey, "email"); System.out.println("Email Field Deleted? " + emailExists); // 关闭连接 jedis.close(); } } ``` 此代码展示了如何创建、修改和删除 Redis Hash 字段,并验证其状态。 #### Python 实现示例 如果更倾向于 Python,则可利用 `redis-py` 库完成类似功能: ```python import redis # 初始化 Redis 连接 r = redis.StrictRedis(host='localhost', port=6379, decode_responses=True) # 用户信息存入 Hash user_key = 'user:1002' user_info = { 'name': 'Alice', 'age': '28', 'city': 'New York' } r.hmset(user_key, user_info) # 查询所有字段 retrieved_user_info = r.hgetall(user_key) print(f"Retrieved User Info: {retrieved_user_info}") # 修改特定字段 r.hset(user_key, 'age', '29') updated_age = r.hget(user_key, 'age') print(f"Updated Age: {updated_age}") # 删除指定字段 r.hdel(user_key, 'city') is_city_deleted = not r.hexists(user_key, 'city') print(f"City Field Deleted? {is_city_deleted}") ``` 这段脚本同样实现了用户的增删改查操作。 #### 内部实现机制 当 Hash 类型中的数据量较小时,Redis 使用紧凑的 ziplist 来保存;随着数据增长超过一定阈值时,会切换至 hashtable 方式来保持 O(1) 时间复杂度下的高性能读写能力[^3]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值