了解 Redis 底层的秘密：从 SDS 动态扩展到内存优化

最新推荐文章于 2025-07-11 19:33:08 发布

原创最新推荐文章于 2025-07-11 19:33:08 发布 · 1k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#redis #java

redis 专栏收录该内容

2 篇文章

订阅专栏

在这里插入图片描述

文章目录

前言

Redis 中的 string 类型是最基本的数据类型之一，尽管它看似简单，底层的实现却非常巧妙和高效。为了更好地处理不同长度的字符串并优化内存和性能，Redis 使用了多种数据结构和编码方案。这篇文章将详细解析 Redis 中 string 底层的实现机制，重点关注 SDS（Simple Dynamic String），以及 Redis 针对字符串的不同编码策略。

string 的编码方式

在 Redis 中，字符串的底层存储方式并不是一成不变的，而是根据字符串的实际情况动态选择不同的编码。主要有以下三种编码：

整数编码（int）：当字符串可以被解析为整数时，Redis 会将其以整数的形式存储。
embstr 编码：用于存储较短的字符串（小于 $44$ 字节）。
raw 编码：用于存储较长的字符串（大于 $44$ 字节）。

这些编码的选择由 Redis 自动完成，用户不需要手动干预。接下来我们将深入了解这些编码方式的底层结构和工作原理。

SDS（Simple Dynamic String）

Redis 的字符串并不是直接使用 C 语言的 char* 类型，而是使用了 SDS（简单动态字符串） 来管理字符串。SDS 是对传统 C 字符串的增强版本，它具有动态扩展、二进制安全等特性。

SDS 的数据结构

SDS 的底层结构如下所示：

struct sdshdr {
    int len;        // 当前字符串的长度
    int free;       // 剩余的空闲空间
    char buf[];     // 实际存储字符串的字符数组，末尾以 '\0' 结束
};

len：表示当前字符串的长度。
free：表示预留的空闲空间，可以用来追加字符串。
buf[]：实际存储字符串内容的字符数组，并且末尾带有 \0，这使 SDS 兼容 C 语言的字符串操作。

例如，如果我们存储字符串 "Hello"，此时 SDS 的状态可能是：

len = 5，表示当前字符串的长度为 $5$ 字节。
free = 3，表示有 $3$ 字节的预留空间用于追加操作。
buf = "Hello\0"，实际存储内容为 "Hello"，并以 \0 结束。

SDS 的动态扩展机制

SDS 最具特色的功能之一是其动态扩展机制。每当追加字符串导致当前 free 空间不足时，SDS 会自动扩展内存。它通过一种 空间预分配策略 来减少频繁的内存分配，优化性能。

内存扩展的步骤：

Step1：首先计算追加操作后字符串的总长度。

Step2：根据当前字符串长度决定扩展策略：

如果字符串长度小于 1MB，则采用 加倍扩展 策略，新分配的内存大小为当前字符串长度的 $2$ 倍。
如果字符串长度超过 1MB，则每次额外分配 1MB 的空间。

Step3：使用底层的 realloc 函数重新分配内存，更新 SDS 的元数据，复制原有内容，并追加新的字符串。

例如，假设当前 SDS 存储的字符串为 "Hello"，len 为 $5$ ，free 为 $3$ ，现在要追加字符串 ", World"，长度为 $7$ 字节。

由于 free 只有 $3$ 字节，无法容纳 $7$ 字节的新内容，因此触发内存扩展。
追加后的字符串长度为 $12$ 字节（“Hello, World”）。
因为新长度小于 1MB，SDS 采用加倍扩展策略，新的内存大小为 $12 \times 2 = 24$ 字节。
扩展后，SDS 的状态变为：
- len = 12，表示新字符串的长度。
- free = 12，表示还有 $12$ 字节的可用空间。
- buf = "Hello, World\0"，存储追加后的字符串。