面试官:你了解过Redis对象底层实现吗
mhr18 2024-10-31 13:24 21 浏览 0 评论
上一章我们讲了Redis的底层数据结构,不了解的人可能会有疑问:这个和平时用的五大对象有啥关系呢?这一章我们就主要解释他们所建立的联系。
看这个文件之前,如果对ziplist、skiplist、intset等数据结构不熟悉的话,建议先回顾一下上一章节:面试官:你看过Redis数据结构底层实现吗?
0. 五类对象分别是什么
五类对象就是我们常用的string、list、set、zset、hash
1. 为什么要有对象
我们平时主要是通过操作对象的api来操作redis,而不是通过它的调用它底层数据结构来完成(外观模式)。但我们还需要了解其底层,只有这样才能写最优化高效的代码。
- 跟java一样,对象使开发更方便简洁,降低开发门槛。开发者不需要了解其复杂的底层API,直接调用高层接口即可实现开发。
- Redis根据对象类型来判断命令是否违法,如果你set key value1 value2就报错。
- 对象下可以包含多种数据结构,使数据存储更加多态化。(下面主讲)
- Reids基于对象做了垃圾回收(引用计数法)。
- 对象带有更丰富的属性,来帮助redis实现更高级的功能。(比如对象的闲置时间)。
2. Redis对象(RedisObject)源码分析
typedef struct redisObject { // 类型 unsigned type:4; // 编码 unsigned encoding:4; // 指向底层实现数据结构的指针 void *ptr; // ... } robj;
type字段
记录对象类型。
我们平时用的命令type <key>,其实就是返回这个字段的属性。
127.0.0.1:6379> set hello world OK 127.0.0.1:6379> type hello string 127.0.0.1:6379> rpush list 1 2 3 (integer) 3 127.0.0.1:6379> type list list ...
那type有多少种类型呢?看下面这个表:
encoding字段
记录对象使用的编码(数据结构),Reids中称数据结构为encoding。
我们可以这样查看我们redis对象中的encoding:
127.0.0.1:6379> object encoding hello "embstr" 127.0.0.1:6379> object encoding list "quicklist" ...
既然它是标明该redisObject是使用的什么数据结构,那肯定也有个对应的表:
我们可以看到,Redis对对象的底层encoding分的很细,String类型就有三个,其它四个对象都分别有两种不同的底层数据结构的实现。他们有一规律,就是用ziplist、intset、embstr来实现少量的数据,数据量一旦庞大,就会升级到skiplist、raw、linkedlist、ht来实现,后面我会仔细讲解。
3. 分别分析各个对象的底层编码实现(数据结构)
3.1 字符串(string)
字符串编码有三个:int、raw、embstr。
3.1.1 int
当string对象的值全部是数字,就会使用int编码。
127.0.0.1:6379> set number 123455 OK 127.0.0.1:6379> object encoding number "int"
3.1.2 embstr
字符串或浮点数长度小于等于39字节,就会使用embstr编码方式来存储,embstr存储内存一般很小,所以redis一次性分配且内存连续(效率高)。
127.0.0.1:6379> set shortStr "suwe suwe suwe" OK 127.0.0.1:6379> object encoding shortStr "embstr"
3.1.2 raw
当一个字符串或浮点数长度大于39字节,就使用SDS来保存,编码为raw,由于不确定值的字节大小,所以键和值各分配各的,所以就分配两次内存(回收也是两次),同理它一定不是内存连续的。
127.0.0.1:6379> set longStr "hello everyone, we dont need to sleep around to go aheard! do you think?" OK 127.0.0.1:6379> object encoding longStr "raw"
3.1.3 编码转换
前面说过,Redis会自动对编码进行转换来适应和优化数据的存储。
int->raw
条件:数字对象进行append字母,就会发生转换。
127.0.0.1:6379> object encoding number "int" 127.0.0.1:6379> append number " is a lucky number" (integer) 24 127.0.0.1:6379> object encoding number "raw"
embstr->raw
条件:对embstr进行修改,redis会先将其转换成raw,然后才进行修改。所以embstr实际上是只读性质的。
127.0.0.1:6379> object encoding shortStr "embstr" 127.0.0.1:6379> append shortStr "(hhh" (integer) 18 127.0.0.1:6379> object encoding shortStr "raw"
3.2 列表(list)
列表对象编码可以是:ziplist或linkedlist。
- ziplist压缩列表不知道大家还记得不,就是zlbytes zltail zllen entry1 entry2 ..end结构,entry节点里有pre-length、encoding、content属性,忘记的可以返回去看下。
- linkedlist,类似双向链表,也是上一章的知识。
3.2.1 编码转换
ziplist->linkedlist
条件:列表对象的所有字符串元素的长度大于等于64字节 & 列表元素数大于等于512. 反之,小于64和小于512会使用ziplist而不是用linkedlist。
这个阈值是可以修改的,修改选项:list-max-ziplist-value和list-max-ziplist-entriess
3.3 哈希(hash)
哈希对象的编码有:ziplist和hashtable
3.3.1 编码转换
ziplist->hashtable
条件:哈希对象所有键和值字符串长度大于等于64字节 & 键值对数量大于等于512
这个阈值也是可以修改的,修改选项:hash-max-ziplist-value和hash-max-ziplist-entriess
3.4. 集合(set)
集合对象的编码有:intset和hashtable
3.4.1 intset
- 集合对象所有元素都是整数
- 集合对象元素数不超过512个
3.4.2 编码转换
intset->hashtable
条件:元素不都是整数 & 元素数大于等于512
3.5. 有序集合(zset)
有序集合用到的编码:ziplist和skiplist
大家可能很好奇阿,ziplist的entry中只有属性content可以存放数据,集合也是key-value形式,那怎么存储呢?
第一个节点保存key、第二个节点保存value 以此类推...
3.5.1 为什么要用这两个编码
- 如果只用ziplist来实现,无法做到元素的排序,不支持范围查找,能做到元素的快速查找。
- 如果只用skiplist来实现,无法做到快速查找,但能做到元素排序、范围操作。
3.5.2 编码转换
ziplist->skiplist
条件:有序集合元素数 >= 128 & 含有元素的长度 >= 64
这个阈值也是可以修改的,修改选项:zset-max-ziplist-value和zset-max-ziplist-entriess
4. 垃圾回收
为什么要说内存回收呢,因为redisObject有一个字段:
typedef struct redisObject { // ... // 引用计数 int refcount; // ... } robj;
redis的垃圾回收采用引用计数法(和jvm一样),底层采用一个变量对对象的使用行为进行计数。
- 初始化为1
- 对象被引用,+1
- 对象引用消除,-1
- 计数器==0, 回收对象
5. 对象共享
5.1 对象共享的体现
- redis中,值是整数值且相等的两个对象,redis会将该对象进行共享,且引用计数+1
- redis启动会自动生成0-9999的整数值放到内存中来共享。
5.2 为什么要对象共享
节约内存
5.3 为什么不对字符串进行共享
成本太高。
验证整数相等只需要O(1)的时间复杂度,而验证字符串要O(n).
6. 对象的空闲时长
最后,redisObject还有一个字段,记录了对象最后一次被访问的时间:
typedef struct redisObject { // ... unsigned lru:22; // ... } robj;
因为这个字段记录对象最后一次被访问的时间,所以它可以用来查看该对象多久未使用,即:用当前时间-lru
127.0.0.1:6379> object idletime hello (integer) 5110
它还关系到redis的热点数据实现,如果我们选择lr算法,当内存超出阈值后会对空闲时长较高的对象进行释放,回收内存。
回复“资源”,领取 练手源码,视频教程,微服务、并发,数据可调优等,搜索【Java知音】
相关推荐
- Java培训机构,你选对了吗?(java培训机构官网)
-
如今IT行业发展迅速,不仅是大学生,甚至有些在职的员工都想学习java开发,需求量的扩大,薪资必定增长,这也是更多人选择java开发的主要原因。不过对于没有基础的学员来说,java技术不是一两天就能...
- 产品经理MacBook软件清单-20个实用软件
-
三年前开始使用MacBookPro,从此再也不想用Windows电脑了,作为生产工具,MacBook可以说是非常胜任。作为产品经理,值得拥有一台MacBook。MacBook是工作平台,要发挥更大作...
- RAD Studio(Delphi) 本月隆重推出新的版本12.3
-
#在头条记录我的2025#自2024年9月,推出Delphi12.2版本后,本月隆重推出新的版本12.3,RADStudio12.3,包含了Delphi12.3和C++builder12.3最...
- 图解Java垃圾回收机制,写得非常好
-
什么是自动垃圾回收?自动垃圾回收是一种在堆内存中找出哪些对象在被使用,还有哪些对象没被使用,并且将后者删掉的机制。所谓使用中的对象(已引用对象),指的是程序中有指针指向的对象;而未使用中的对象(未引用...
- Centos7 初始化硬盘分区、挂载(针对2T以上)添加磁盘到卷
-
1、通过命令fdisk-l查看硬盘信息:#fdisk-l,发现硬盘为/dev/sdb大小4T。2、如果此硬盘以前有过分区,则先对磁盘格式化。命令:mkfs.文件系统格式-f/dev/sdb...
- 半虚拟化如何提高服务器性能(虚拟化 半虚拟化)
-
半虚拟化是一种重新编译客户机操作系统(OS)将其安装在虚拟机(VM)上的一种虚拟化类型,并在主机操作系统(OS)运行的管理程序上运行。与传统的完全虚拟化相比,半虚拟化可以减少开销,并提高系统性能。虚...
- HashMap底层实现原理以及线程安全实现
-
HashMap底层实现原理数据结构:HashMap的底层实现原理主要依赖于数组+链表+红黑树的结构。1、数组:HashMap最底层是一个数组,称为table,它存放着键值对。2、链...
- long和double类型操作的非原子性探究
-
前言“深入java虚拟机”中提到,int等不大于32位的基本类型的操作都是原子操作,但是某些jvm对long和double类型的操作并不是原子操作,这样就会造成错误数据的出现。其实这里的某些jvm是指...
- 数据库DELETE 语句,还保存原有的磁盘空间
-
MySQL和Oracle的DELETE语句与数据存储MySQL的DELETE操作当你在MySQL中执行DELETE语句时:逻辑删除:数据从表中标记为删除,不再可见于查询结果物理...
- 线程池—ThreadPoolExecutor详解(线程池实战)
-
一、ThreadPoolExecutor简介在juc-executors框架概述的章节中,我们已经简要介绍过ThreadPoolExecutor了,通过Executors工厂,用户可以创建自己需要的执...
- navicat如何使用orcale(详细步骤)
-
前言:看过我昨天文章的同鞋都知道最近接手另一个国企项目,数据库用的是orcale。实话实说,也有快三年没用过orcale数据库了。这期间问题不断,因为orcale日渐消沉,网上资料也是真真假假,难辨虚...
- 你的程序是不是慢吞吞?GraalVM来帮你飞起来性能提升秘籍大公开
-
各位IT圈内外的朋友们,大家好!我是你们的老朋友,头条上的IT技术博主。不知道你们有没有这样的经历:打开一个软件,半天没反应;点开一个网站,图片刷不出来;或者玩个游戏,卡顿得想砸电脑?是不是特别上火?...
- 大数据正当时,理解这几个术语很重要
-
目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并...
- 秒懂列式数据库和行式数据库(列式数据库的特点)
-
行式数据库(Row-Based)数据按行存储,常见的行式数据库有Mysql,DB2,Oracle,Sql-server等;列数据库(Column-Based)数据存储方式按列存储,常见的列数据库有Hb...
- AMD发布ROCm 6.4更新:带来了多项底层改进,但仍不支持RDNA 4
-
AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm6.4。这一新版本里,AMD带来了多项底层改进,包括更新改进了ROCm的用户空间库和AMDKFD内核驱动程序之间的兼容性,使其更容易...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle 空为0 (51)
- oracle主从同步 (56)
- oracle 乐观锁 (53)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)