跳表(Skip List)是一种 多层有序链表 结构,通过“分层索引”的方式优化普通单链表的查找效率。它的核心思路是:在底层链表的基础上,建立若干层“索引层”,上层索引节点是下层节点的“抽样”,从而实现快速跳过无效节点,加速查找、插入、删除等操作。
为什么需要跳表?
普通单链表的查找效率很低(时间复杂度 O(n)),因为每次查找必须从表头逐个遍历。例如,要找第1000个节点,必须从头走1000步。
跳表通过“分层”解决这个问题:
- 底层是完整的有序单链表(存储所有数据)。
- 上层是索引层,每一层的节点数量比下一层少(类似“高速公路”,让查找能快速“超车”)。
比如:
- 底层(第1层):1 → 2 → 3 → 4 → 5 → 6 → … → 1000(所有节点)
- 第2层(抽样):1 → 3 → 5 → … → 999(每隔1个节点抽1个)
- 第3层(更上层抽样):1 → 5 → 9 → … → 997(每隔3个节点抽1个)
- …
查找时,从最高层索引开始,快速跳过大部分节点,逐步降到下层,最终在底层找到目标。例如找“6”:
- 从最高层(假设第3层)的1开始,发现下一个节点是5(小于6),跳到5。
- 第3层5的下一个节点大于6,降到第2层。
- 第2层5的下一个节点是7(大于6),降到第1层。
- 第1层5的下一个节点就是6,找到目标。
原本需要6步,现在只需4步,数据量越大,优化越明显。
跳表的核心实现细节
1. 节点结构
每个节点包含:
- 数据:存储的值(如Redis中的
score和obj)。 - 多层指针:每个层级对应一个指针,指向同层的下一个节点(例如
level[0]是第1层指针,level[1]是第2层指针)。 - 跨度(span):当前节点到同层下一个节点的距离(用于计算排名,如Redis的
ZRANK命令)。 - 后退指针:仅底层有,指向前一个节点(用于反向遍历)。
2. 层级的生成
节点的层级不是固定的,而是 随机生成 的(层数越高概率越低):
- 初始层级为1。
- 有50%的概率增加1层(通过随机数判断),直到达到最大层数(如Redis限制最大32层)。
这种随机机制保证了跳表的层级分布相对均匀,避免某一层节点过多导致性能下降。
3. 查找操作
- 从跳表的最高层开始,用当前节点的同层指针向后比较:
- 若下一个节点的值小于目标,移动到下一个节点。
- 若下一个节点的值大于目标,降低一层继续查找。
- 重复直到降到第1层,找到目标或确认不存在。
时间复杂度平均为 O(log n),接近平衡树,但实现更简单。
4. 插入操作
- 步骤1:随机生成新节点的层级。
- 步骤2:从最高层开始,查找新节点在各层的插入位置(记录每层的前驱节点)。
- 步骤3:创建新节点,更新前驱节点的指针(指向新节点)和跨度,同时新节点的指针指向原前驱节点的下一个节点。
- 步骤4:若新节点的层级高于跳表现有最高层级,更新跳表的最高层级。
5. 删除操作
- 类似插入,先找到目标节点在各层的前驱节点。
- 依次更新各层前驱节点的指针(跳过目标节点)和跨度。
- 若删除后最高层没有节点,降低跳表的最高层级。
总结
跳表通过“分层索引+随机层级”的设计,用相对简单的实现达到了接近平衡树的性能(查找、插入、删除均为平均O(log n))。它的优势在于:
- 实现比平衡树简单(无需复杂的旋转操作)。
- 范围查询高效(如“找值在10到20之间的节点”,可直接通过层级指针遍历区间)。
这也是Redis在有序集合(Sorted Set)中选择跳表的核心原因。
1万+

被折叠的 条评论
为什么被折叠?



