百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

「Redis 系列 02」Redis 简单动态字符串

mhr18 2024-11-12 11:26 18 浏览 0 评论

之前给大家总结了线上 OOM 的情况,相信大家也能从中学到一些东西,身为一名有追求的程序员,阿粉我的理解是光会吃老本是不行的,所以我一直也在学习,今天大家就跟我一起来了解一下 Redis 的 SDS 吧(不是 SOS 哦~)。

01、SDS 数据结构

Redis 底层是基于 C 语言来开发的,但是它没有采用 C 语言传统的字符串表示方式,而是自定义了一种叫做 SDS(Sample Dynamic String,简单动态字符串)的数据结构来表示字符串。传统的 C 语言的字符串是采用空字符(\0)作为结尾的字符数组,SDS 的数据结构稍微复杂一点,整个结构包含三个部分,是 Redis 的基础。(阿粉猜测这里就是传说中的青出于蓝而胜于蓝)。

1.1、数据结构

在源码 sds.h/sdshdr 结构体中定于了 SDS 的数据结构,包括三个部分,free,len,buf[],依次含义如下

  1. buf[]:字节数组,用于存放实际的字符串;
  2. len:记录 buf 数组中已经使用的字节数量,等同于 SDS 所保存的字符串的长度;
  3. free:记录 buf 数组中未使用的字节的数量。

说明

上图中的 SDS 表示一个存放了 ‘RED’ 字符串,已经使用的长度为 3,未使用的长度为 2(这里用空白格表示未使用),其中的 ‘\0’ 表示的是字符串的结束,不计算在 SDS 的 len 中,并且由 SDS 底层函数自动添加,对使用者来说是透明。这里统一采用空字符(\0)结尾是为了复用 C 语言的相关函数。这个相信大家也很能理解,毕竟有祖宗可以靠,没必要全靠自己那么辛苦~。

02、为什么采用 SDS

2.1、SDS 与 C语言字符串的区别

在说明 Redis 为什么要自定义 SDS 之前,阿粉觉得我们应该先看一下 SDS 与传统的 C 语言的字符串有什么区别,知道了具体的区别我们才能知道这样实现的原因是什么。

2.1.1、O(1) 获取字符串的长度

传统的 C 语言字符串如果要获取字符串的长度,则需要遍历整个字符串,直到遇到 ‘\0’ 字符,才知道整个字符串的长度是多少,操作复杂度是 O(n) 的。但是在 SDS 中,由于我们记录了字符串的长度,所以在获取字符串长度的时候是可以直接获取的,整个操作为 O(1)。

如上面的示例,我们可以直接获取字符串的长度是 3,而不需要遍历,另外字符串 Key 在 Redis 的底层实现就是采用 SDS 的,所以这个特性就保证了我们在计算 Key 的长度的时候不会出现任何瓶颈,对系统的性能不会有任何影响。

2.1.2、动态扩容

由于 SDS 中记录了未使用的空间大小,所以如果出现对已有字符串进行修改或者赋值时,SDS 底层函数会自动检测剩余空间是否能满足此次修改,如果 free 空间足够则直接修改;如果 free 空间不够则会先进行动态扩容达到能满足的空间大小,然后再执行修改动作。整个扩容的动作是 SDS 底层函数自动完成,对使用者无感。

而对于传统的 C 语言字符串,如果在修改前忘记手动扩容则会导致字符串后面的数据被覆盖。这里阿粉就不得不说一句了,为了方便大众程序员,另一些骨灰级程序员(嗯,仿佛看到了未来的阿粉)也是操碎了心啊~

2.1.3、减少内存分配次数

在传统的 C 语言的字符串,我们每次对字符串的修改都会涉及到字符串内存的重新分配,不管是增加还是减少字符串的长度。这种情况下,如果我们多次对字符串的长度进行调整的时候就会导致多次的内存重新分配。

而在 SDS 中我们在对一个 SDS 初始化的时候会根据实际 buf[] 字符串的长度进行预先空间分配,并且标记为 free。这种方式叫做空间预分配,在很大程度上可以减少增加字符串长度导致内存重新分配的情况。free 的空间分配的策略是根据 buf[] 大小来决定的,如果 buf[] 大小小于 1MB,则 len 多大 free 就多大;如果 buf[] 大小大于 1MB,则 free 固定设置为 1MB。

上面说的是SDS 字符串的长度增加,另外如果 SDS 的字符串长度减少,那么 SDS 会将减少的长度存放到 free 中,而不是直接回收,这样可以方便下次如果再次使用,减少内存重新分配。这种策略叫做惰性空间释放

同样的上面两种操作对使用者是完全无感的,阿粉觉得这种方案还是很合理的,不知道“元芳”你怎么看?

2.1.4、二进制安全

我们都知道 Redis 是可以存储各种类型数据的,不仅是字符串也可以存储图片,视频等二进制数据流。这是由于 Redis 不依赖一 ‘\0’ 空字符作为结束字符。C 语言之所以不支持就是因为二进制流中会携带 ‘\0’ 字符,导致无法知道字符串真实的结束位置。这就带来了另一个 Redis 特性,就是二进制的安全性。

2.2 为什么使用 SDS

通过上面阿粉提到的内容我们知道了 SDS 比传统的 C 语言的字符串有很多优势,也正是这些必不可少的优势才促成了 SDS的存在。Redis 是一个高性能的内存数据库,所以在性能方面要求特别高,这种设计方式虽然浪费了一定的空间,但是为了达到性能的要求也是值得的。有空间换时间的这种方式,在软件设计的领域还是很多的。

2.3 SDS 常用 API

上面阿粉说的都是一些原理,下面从源码上给大家展示一下。在 2.1 中提到有获取长度 len 和释放空间 free 的动作,那么对应在 SDS 底层必定会有提供支持的 API,下面我们通过源码来看几个常用的 API。

  1. 在源码 sds.c 文件中 sdsfree 函数定义如下
/* Free an sds string. No operation is performed if 's' is NULL. */
void sdsfree(sds s) {
    if (s == NULL) return;
    s_free((char*)s-sdsHdrSize(s[-1]));
}
  1. 在源码 sds.h 文件中 sdslen 函数定义如下
12345678910111213141516
static inline size_t sdslen(const sds s) {
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5:
            return SDS_TYPE_5_LEN(flags);
        case SDS_TYPE_8:
            return SDS_HDR(8,s)->len;
        case SDS_TYPE_16:
            return SDS_HDR(16,s)->len;
        case SDS_TYPE_32:
            return SDS_HDR(32,s)->len;
        case SDS_TYPE_64:
            return SDS_HDR(64,s)->len;
    }
    return 0;
}

上面两个是 SDS 底层对应的 sdsfree 和 sdslen 函数,用于释放 SDS 空间和获取 SDS 的长度。

  1. 在源码 sds.c 文件中创建 sds 的函数定义如下
/* Create an empty (zero length) sds string. Even in this case the string
 * always has an implicit null term. */
sds sdsempty(void) {
    return sdsnewlen("",0);
}

/* Create a new sds string starting from a null terminated C string. */
sds sdsnew(const char *init) {
    size_t initlen = (init == NULL) ? 0 : strlen(init);
    return sdsnewlen(init, initlen);
}

上面两个是 SDS 底层对应的 sdsempty 和 sdsnew 函数,顾名思义就是创建空的 SDS 和创建一个新的 SDS 字符串。

03、总结

这篇文章阿粉跟大家介绍了一下 Redis 的 SDS 和 SDS 底层的组成结构,并且与 C 语言传统字符串进行的详细的对比,阐述了 SDS 出现解决了哪些问题,最后带大家从源码中简单的看了几个底层的函数实现。 在走向骨灰级程序员的道路上,阿粉我从不懈怠,充满斗志,那么你呢?是否跟阿粉一样,对未来充满期待! 今天是 2020 年的第一个周末,所以你想怎么过能?欢迎加入到我们 Java 极客技术的知识星球中进行留言,我们共同进步成长。

04、参考文档

  1. https://github.com/antirez/redis
  2. https://redis.io/
  3. 《Redis 设计与实现(第二版)》——黄建宏

相关推荐

Dubai's AI Boom Lures Global Tech as Emirate Reinvents Itself as Middle East's Silicon Gateway

AI-generatedimageAsianFin--Dubaiisrapidlytransformingitselffromadesertoilhubintoaglob...

OpenAI Releases o3-pro, Cuts o3 Prices by 80% as Deal with Google Cloud Reported to Make for Compute Needs

TMTPOST--OpenAIisescalatingthepricewarinlargelanguagemodel(LLM)whileseekingpartnershi...

黄仁勋说AI Agent才是未来!但究竟有些啥影响?

,抓住风口(iOS用户请用电脑端打开小程序)本期要点:详解2025年大热点你好,我是王煜全,这里是王煜全要闻评论。最近,有个词被各个科技大佬反复提及——AIAgent,智能体。黄仁勋在CES展的发布...

商城微服务项目组件搭建(五)——Kafka、Tomcat等安装部署

1、本文属于mini商城系列文档的第0章,由于篇幅原因,这篇文章拆成了6部分,本文属于第5部分2、mini商城项目详细文档及代码见CSDN:https://blog.csdn.net/Eclipse_...

Python+Appium环境搭建与自动化教程

以下是保姆级教程,手把手教你搭建Python+Appium环境并实现简单的APP自动化测试:一、环境搭建(Windows系统)1.安装Python访问Python官网下载最新版(建议...

零配置入门:用VSCode写Java代码的正确姿

一、环境准备:安装JDK,让电脑“听懂”Java目标:安装Java开发工具包(JDK),配置环境变量下载JDKJava程序需要JDK(JavaDevelopmentKit)才能运行和编译。以下是两...

Mycat的搭建以及配置与启动(mycat2)

1、首先开启服务器相关端口firewall-cmd--permanent--add-port=9066/tcpfirewall-cmd--permanent--add-port=80...

kubernetes 部署mysql应用(k8s mysql部署)

这边仅用于测试环境,一般生产环境mysql不建议使用容器部署。这里假设安装mysql版本为mysql8.0.33一、创建MySQL配置(ConfigMap)#mysql-config.yaml...

Spring Data Jpa 介绍和详细入门案例搭建

1.SpringDataJPA的概念在介绍SpringDataJPA的时候,我们首先认识下Hibernate。Hibernate是数据访问解决技术的绝对霸主,使用O/R映射(Object-Re...

量子点格棋上线!“天衍”邀您执子入局

你是否能在策略上战胜量子智能?这不仅是一场博弈更是一次量子智力的较量——量子点格棋正式上线!试试你能否赢下这场量子智局!游戏玩法详解一笔一画间的策略博弈游戏目标:封闭格子、争夺领地点格棋的基本目标是利...

美国将与阿联酋合作建立海外最大的人工智能数据中心

当地时间5月15日,美国白宫宣布与阿联酋合作建立人工智能数据中心园区,据称这是美国以外最大的人工智能园区。阿布扎比政府支持的阿联酋公司G42及多家美国公司将在阿布扎比合作建造容量为5GW的数据中心,占...

盘后股价大涨近8%!甲骨文的业绩及指引超预期?

近期,美股的AI概念股迎来了一波上升行情,微软(MSFT.US)频创新高,英伟达(NVDA.US)、台积电(TSM.US)、博通(AVGO.US)、甲骨文(ORCL.US)等多股亦出现显著上涨。而从基...

甲骨文预计新财年云基础设施营收将涨超70%,盘后一度涨8% | 财报见闻

甲骨文(Oracle)周三盘后公布财报显示,该公司第四财季业绩超预期,虽然云基建略微逊于预期,但管理层预计2026财年云基础设施营收预计将增长超过70%,同时资本支出继上年猛增三倍后,新财年将继续增至...

Springboot数据访问(整合MongoDB)

SpringBoot整合MongoDB基本概念MongoDB与我们之前熟知的关系型数据库(MySQL、Oracle)不同,MongoDB是一个文档数据库,它具有所需的可伸缩性和灵活性,以及所需的查询和...

Linux环境下,Jmeter压力测试的搭建及报错解决方法

概述  Jmeter最早是为了测试Tomcat的前身JServ的执行效率而诞生的。到目前为止,它的最新版本是5.3,其测试能力也不再仅仅只局限于对于Web服务器的测试,而是涵盖了数据库、JM...

取消回复欢迎 发表评论: