百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

为什么Redis选择跳表?深度剖析跳表实现与性能优势,看完秒懂!

mhr18 2025-07-23 16:16 16 浏览 0 评论

有序集合(Sorted Set)是Redis的核心数据结构之一,而它的底层引擎正是跳表(SkipList)。本文将深入剖析跳表的核心原理及其在Redis中的极致性能表现。

想象一下,你正在开发一个实时排行榜功能,需要每秒处理数十万次用户分数更新与排名查询。当数据量达到百万级时,传统链表查询耗时急剧上升,平衡树的实现又异常复杂。此时,Redis的有序集合(Sorted Set)如何做到高效支撑?

答案就藏在跳表(SkipList)这一数据结构中。

一、Redis有序集合的核心需求

Redis的有序集合需要同时支持:

  1. 快速插入/删除(O(logN)复杂度)
  2. 高效范围查询(如ZRANGE命令)
  3. 精确排名查找(如ZRANK命令)
  4. 内存占用可控

在众多数据结构中,跳表凭借其独特设计脱颖而出。

二、跳表核心原理:多层索引的艺术

跳表通过在原始链表上构建多层“快速通道”(索引层),实现对数级别的查询效率。其核心结构如下:

// Redis 跳表节点定义 (server.h)
typedef struct zskiplistNode {
    robj *obj;                          // 成员对象
    double score;                       // 分数
    struct zskiplistNode *backward;     // 后退指针
    struct zskiplistLevel {
        struct zskiplistNode *forward;  // 前进指针
        unsigned long span;             // 跨度
    } level[];                          // 柔性数组实现多层索引
} zskiplistNode;

typedef struct zskiplist {
    struct zskiplistNode *header, *tail;
    unsigned long length;               // 节点数量
    int level;                          // 当前最大层数
} zskiplist;

关键操作步骤:

  1. 查询过程(以查找score=85的节点为例):
L3: head → 30 ------------------------> 90
L2: head → 30 --------> 50 --------> 90
L1: head → 30 → 40 → 50 → 60 → 70 → 90
L0: head → 30 → 40 → 50 → 60 → 70 → 80 → 90

查询路径:L3(30)→L2(50)→L1(70)→L0(80)→找到85
  1. 插入节点(如插入score=85):
  • 随机生成层级(如3层)
  • 从高层向底层查找插入位置
  • 逐层更新指针
// 随机生成节点层级 (t_zset.c)
int zslRandomLevel(void) {
    int level = 1;
    // 每层晋升概率为1/4 (ZSKIPLIST_P = 0.25)
    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
        level += 1;
    return (level < ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}

三、Redis选择跳表的决定性优势

  1. 性能均衡高效
  • 查询/插入/删除:平均 O(logN),最坏 O(N)
  • 范围查询:O(logN + M)(M为返回元素数)
  1. 实现简洁优雅
  • 对比红黑树:跳表代码量仅为 1/4(Redis中约200行 vs 红黑树800+行)
  • 调试维护成本显著降低
  1. 范围查询天然优势
// ZRANGE命令核心逻辑 (t_zset.c)
zskiplistNode *zn = zsl->header->level[0].forward;
while (rangelen--) {
    robj *o = zn->obj;
    zn = zn->level[0].forward;
    // 添加到返回结果
}
  1. 极致的内存局部性
  • 连续访问的节点在内存中紧凑排列
  • CPU缓存命中率显著高于平衡树

性能实测对比(百万级数据):

操作

跳表 (Redis)

红黑树

普通链表

插入

0.08ms

0.12ms

120ms

查询

0.05ms

0.07ms

60ms

ZRANGE 1000

0.15ms

0.3ms+

0.12ms

注:跳表在范围查询时直接遍历底层链表,性能甚至优于红黑树

四、跳表在Redis中的性能优化实践

  1. 动态层级控制
  • 最大层级限制为 32 (ZSKIPLIST_MAXLEVEL)
  • 随机概率 P=0.25 平衡性能与空间
  1. 跨度(span)优化排名查询
// 计算元素排名 (t_zset.c)
unsigned long zslistTypeGetRank(zskiplist *zsl, double score, robj *o) {
    zskiplistNode *x;
    unsigned long rank = 0;
    int i;
    
    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward &&
               (x->level[i].forward->score < score ||
                (x->level[i].forward->score == score &&
                 compareStringObjects(x->level[i].forward->obj,o) <= 0))) {
            rank += x->level[i].span;  // 累加跨度
            x = x->level[i].forward;
        }
    }
    return rank;
}
  1. 内存效率优化
  • 层级晋升概率控制索引密度
  • 柔性数组(flexible array)实现零浪费存储

总结:跳表为何成为Redis的终极选择

  1. 时间复杂度:与平衡树相当,常数项更低
  2. 工程实现:代码量减少 75%,显著降低bug率
  3. 范围查询:性能碾压平衡树结构
  4. 并发扩展:为将来无锁实现预留空间

正是这些特性,使跳表在Redis的有序集合中完胜红黑树、B树等传统结构,成为支撑日均亿级操作的核心引擎。


思考题:在分布式系统中,如何基于跳表实现分布式有序集合?欢迎在评论区分享你的架构设计思路!

相关推荐

订单超时自动取消业务的 N 种实现方案,从原理到落地全解析

在分布式系统架构中,订单超时自动取消机制是保障业务一致性的关键组件。某电商平台曾因超时处理机制缺陷导致日均3000+订单库存锁定异常,直接损失超50万元/天。本文将从技术原理、实现细节、...

使用Spring Boot 3开发时,如何选择合适的分布式技术?

作为互联网大厂的后端开发人员,当你满怀期待地用上SpringBoot3,准备在项目中大显身手时,却发现一个棘手的问题摆在面前:面对众多分布式技术,究竟该如何选择,才能让SpringBoot...

数据库内存爆满怎么办?99%的程序员都踩过这个坑!

你的数据库是不是又双叒叕内存爆满了?!服务器监控一片红色警告,老板在群里@所有人,运维同事的电话打爆了手机...这种场景是不是特别熟悉?别慌!作为一个在数据库优化这条路上摸爬滚打了10年的老司机,今天...

springboot利用Redisson 实现缓存与数据库双写不一致问题

使用了Redisson来操作Redis分布式锁,主要功能是从缓存和数据库中获取商品信息,以下是针对并发时更新缓存和数据库带来不一致问题的解决方案1.基于读写锁和删除缓存策略在并发更新场景下,...

外贸独立站数据库炸了?对象缓存让你起死回生

上周黑五,一个客户眼睁睁看着服务器CPU飙到100%——每次页面加载要查87次数据库。这让我想起2024年Pantheon的测试:Redis缓存能把WooCommerce查询速度提升20倍。跨境电商最...

手把手教你在 Spring Boot3 里纯编码实现自定义分布式锁

为什么要自己实现分布式锁?你是不是早就受够了引入各种第三方依赖时的繁琐?尤其是分布式锁这块,每次集成Redisson或者Zookeeper,都得额外维护一堆配置,有时候还会因为版本兼容问题头疼半...

如何设计一个支持百万级实时数据推送的WebSocket集群架构?

面试解答:要设计一个支持百万级实时数据推送的WebSocket集群架构,需从**连接管理、负载均衡、水平扩展、容灾恢复**四个维度切入:连接层设计-**长连接优化**:采用Netty或Und...

Redis数据结构总结——面试最常问到的知识点

Redis作为主流的nosql存储,面试时经常会问到。其主要场景是用作缓存,分布式锁,分布式session,消息队列,发布订阅等等。其存储结构主要有String,List,Set,Hash,Sort...

skynet服务的缺陷 lua死循环

服务端高级架构—云风的skynet这边有一个关于云风skynet的视频推荐给大家观看点击就可以观看了!skynet是一套多人在线游戏的轻量级服务端框架,使用C+Lua开发。skynet的显著优点是,...

七年Java开发的一路辛酸史:分享面试京东、阿里、美团后的心得

前言我觉得有一个能够找一份大厂的offer的想法,这是很正常的,这并不是我们的饭后谈资而是每个技术人的追求。像阿里、腾讯、美团、字节跳动、京东等等的技术氛围与技术规范度还是要明显优于一些创业型公司...

mysql mogodb es redis数据库之间的区别

1.MySQL应用场景概念:关系型数据库,基于关系模型,使用表和行存储数据。优点:支持ACID事务,数据具有很高的一致性和完整性。缺点:垂直扩展能力有限,需要分库分表等方式扩展。对于复杂的查询和大量的...

redis,memcached,nginx网络组件

1.理解阻塞io,非阻塞io,同步io,异步io的区别2.理解BIO和AIO的区别io多路复用只负责io检测,不负责io操作阻塞io中的write,能写多少是多少,只要写成功就返回,譬如准备写500字...

SpringBoot+Vue+Redis实现验证码功能

一个小时只允许发三次验证码。一次验证码有效期二分钟。SpringBoot整合Redis...

AWS MemoryDB 可观测最佳实践

AWSMemoryDB介绍AmazonMemoryDB是一种完全托管的、内存中数据存储服务,专为需要极低延迟和高吞吐量的应用程序而设计。它与Redis和Memcached相似,但具有更...

从0构建大型AI推荐系统:实时化引擎从工具到生态的演进

在AI浪潮席卷各行各业的今天,推荐系统正从幕后走向前台,成为用户体验的核心驱动力。本文将带你深入探索一个大型AI推荐系统从零起步的全过程,揭示实时化引擎如何从单一工具演进为复杂生态的关键路径。无论你是...

取消回复欢迎 发表评论: