redis 常用数据类型及底层实现简介

Redis 提供了五种基本的数据结构(Key-Value 类型),并根据不同的使用场景和数据量大小,采用不同的底层数据结构进行优化。以下是 Redis 基本数据结构及其底层实现的详细说明:

一、5种基本数据结构及底层实现

1. 字符串(String)

  • 底层实现
    简单动态字符串(SDS, Simple Dynamic String)

    • 特点
      • SDS 是 Redis 自定义的字符串结构,解决了 C 语言字符串的缺陷(如非二进制安全、无法高效获取长度等)。
      • 每个 SDS 结构包含 len(已使用长度)、free(未使用长度)和 buf[](存储实际数据的字节数组)。
      • 支持动态扩容(如 len < 1MB 时扩容到 2*len,否则扩容 len + 1MB)。
    • 示例结构
      struct sdshdr {
          int len;     // 已使用长度
          int free;    // 未使用长度
          char buf[];  // 实际存储的字节数组
      }
      
  • 应用场景

    • 缓存、计数器、分布式锁、存储小对象等。

2. 列表(List)

  • 底层实现
    双向链表(Linked List)压缩列表(Ziplist),根据数据量和配置动态切换:

    • Redis 3.2 之前
      • 小数据量(默认 list-max-ziplist-size 配置):使用 Ziplist
      • 大数据量:使用 双向链表(LinkedList)
    • Redis 3.2 之后
      • 统一使用 QuickList(双向链表 + Ziplist 的组合)。
      • QuickList 将链表的每个节点替换为 Ziplist,减少内存碎片并提高性能。
  • 特点

    • 双向链表支持 O(1) 的头尾插入/删除操作。
    • Ziplist 通过连续内存存储数据,节省内存但牺牲随机访问效率。
  • 应用场景

    • 消息队列、日志记录、分页查询等。

3. 哈希(Hash)

  • 底层实现
    字典(Dict, Hash Table)压缩列表(Ziplist),根据数据量动态切换:

    • 小数据量(默认 hash-max-ziplist-entries=512hash-max-ziplist-value=64):使用 Ziplist
    • 大数据量:使用 字典(Dict)
  • 特点

    • 字典基于哈希表实现,支持 O(1) 的增删改查。
    • Ziplist 通过连续内存存储键值对,节省内存但限制了数据规模。
  • 应用场景

    • 存储对象(如用户信息)、缓存配置、购物车等。

4. 集合(Set)

  • 底层实现
    整数集合(Intset)字典(Dict),根据数据类型动态切换:

    • 元素为整数且数量较小(默认 set-max-intset-entries=512):使用 Intset
    • 其他情况:使用 字典(Dict)(键存储元素,值为空)。
  • 特点

    • Intset 是一个有序的整数数组,支持类型升级(如从 int16_t 升级到 int32_t)。
    • 字典通过哈希表实现去重和快速查找。
  • 应用场景

    • 标签系统、好友关系、抽奖池等。

5. 有序集合(Sorted Set, ZSet)

  • 底层实现
    跳跃表(Skip List) + 字典(Dict)压缩列表(Ziplist),根据数据量动态切换:

    • 小数据量(默认 zset-max-ziplist-entries=128zset-max-ziplist-value=64):使用 Ziplist
    • 大数据量:使用 跳跃表 + 字典
      • 跳跃表用于按分数排序(O(log N) 查找)。
      • 字典用于快速定位元素(O(1) 查找)。
  • 特点

    • 跳跃表通过多层链表实现高效排序和范围查询。
    • Ziplist 通过连续内存存储元素和分数,节省内存。
  • 应用场景

    • 排行榜、时间序列数据、优先队列等。

二、其他特殊数据结构(底层实现)

Redis 还利用以下底层数据结构支持更多高级功能:

  1. 位图(Bitmap)

    • 底层基于字符串(SDS)实现,通过位操作(SETBIT, GETBIT)存储布尔值。
    • 应用场景:用户活跃统计、签到系统等。
  2. HyperLogLog

    • 基于概率算法(LogLog 算法)估算基数(UV 统计),底层使用固定大小的数组(12KB)。
  3. 地理空间(Geo)

    • 底层基于有序集合(ZSet)实现,通过 GEOADDGEORADIUS 存储和查询地理坐标。
  4. 流(Stream)

    • 底层基于 Radix Tree 实现,支持高效的消息追加和消费组管理。

三、总结对比表

Redis 数据类型底层实现(小数据量)底层实现(大数据量)特点
StringSDSSDS二进制安全,动态扩容
ListZiplistQuickList支持 O(1) 插入/删除
HashZiplistDict键值对存储,内存高效
SetIntsetDict无序去重集合
ZSetZiplistSkip List + Dict有序去重集合,支持范围查询
BitmapSDSSDS位操作,节省内存
HyperLogLog固定数组固定数组基数估算,误差率低
GeoZSetZSet地理坐标存储与查询

四、设计原则

  1. 内存与性能的平衡

    • 小数据量时优先使用压缩列表(Ziplist)节省内存。
    • 大数据量时切换到更高效的结构(如字典、跳跃表)。
  2. 渐进式 Rehash

    • 哈希表扩容时通过分阶段迁移数据(避免一次性耗时操作)。
  3. 编码转换

    • 根据数据特性动态切换底层结构(如 Hash 从小到大转换为字典)。

通过灵活的底层数据结构设计,Redis 在高性能和内存效率之间实现了良好的平衡,适用于多种业务场景。

### Redis 的基础数据结构及其底层实现 #### 字符串 (String) 字符串是最简单的键值对存储形式,在 Redis 中,字符串可以保存任何形式的二进制安全字符串[^1]。对于较小的对象,Redis 使用简单动态字符串(SDS, Simple Dynamic String),它是一个封装后的 C 字符串,提供了额外的功能并解决了传统 C 字符串的一些缺陷。 优点在于操作简便快速;缺点则是当数值较大时执行某些命令可能会阻塞服务器进程。适用于缓存少量数据或者计数器场景。 ```python SET key value GET key INCR key DECR key ``` #### 列表 (List) 列表由链表实现,支持两端高效插入删除节点的操作,但是随机访问效率较低。适合用于消息队列、最新N条记录等功能需求。 优点是可以轻松地向头部或尾部添加元素而不影响其他部分;缺点是在获取中间位置元素时性能较差。典型应用场景包括聊天室的消息推送以及社交网络中的时间线更新等。 ```python LPUSH mylist "world" RPUSH mylist "hello" LRANGE mylist 0 -1 ``` #### 集合 (Set) 集合基于哈希表构建而成,能够保证成员唯一性的同时提供高效的查找速度。可用于去重统计、好友关系维护等方面的工作。 优势体现在能迅速判断某个元素是否存在集合之中;劣势则是因为内部采用散列表来表示所以占用空间相对较多一些。常见用途有标签系统管理、权限控制下的资源分配策略制定等等。 ```python SADD myset "member1" SMEMBERS myset SCARD myset ``` #### 有序集合 (Sorted Set) 有序集合同样依赖于字典树加跳跃表的数据模型组合起来完成排序功能。除了具备常规 set 类型的特点外还能按照分数顺序排列各个项目。 长处在于既保留了无序版本的优点又增加了按需检索的能力;短处就是每次修改都会引起整个索引重建从而带来一定开销。实际应用广泛存在于排行榜展示、优先级任务调度等领域之内。 ```python ZADD mystoredset 1 "one" ZADD mystoredset 2 "two" ZRANGE mystoredset 0 -1 WITHSCORES ``` #### 哈希表 (Hash) 哈希表用来储存对象字段和属性之间的映射关系。通过这种方式可以在一次请求里批量处理多个子项的信息读写事务。 好处是简化了复杂实体建模过程并且提高了并发度;坏处可能造成内存碎片化加剧进而降低整体吞吐量表现。一般会出现在商品详情页加载或是用户资料编辑页面当中。 ```python HSET user:1 name "Alice" HGETALL user:1 HEXISTS user:1 age ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值