Redis基本数据结构之集合(redis集合和有序集合)
mhr18 2024-10-28 16:22 23 浏览 0 评论
纸上得来终觉浅,绝知此事要躬行!
集合,也是用来保存多个元素的一种数据结构,和之前介绍的列表有所区别:
- 集合元素不允许重复;列表元素可重复;
- 集合元素是无序的;列表元素是有序的;
内部编码
集合的内部编码分为两种:intset和hashtable。
(1)整数集合intset
从命名上,我们就可以看出来,intset是整数集合,所以,当集合内元素都是整数的时候,会使用intset作为内部编码,但也是有限制的,限制是什么呢?
# Sets have a special encoding in just one case: when a set is composed
# of just strings that happen to be integers in radix 10 in the range
# of 64 bit signed integers.
# The following configuration setting sets the limit in the size of the
# set in order to use this special memory saving encoding.
set-max-intset-entries 512
简单翻译一下:集合仅在一种情况下,使用特殊的内部编码,即当集合恰好是由64位有符号整数范围内的10进制整数组成时,下边这个配置项是配置intset编码保存的元素的最大个数。翻译过来,也就一目了然了。
typedef struct intset{
uint32_t encoding;
uint32_t length;
int8_t content[];
} intset;
从intset的结构可以看出,底层使用的是一个整数数组实现的。并且有一个length记录长度,所以当获取intset编码的集合的长度时,时间复杂度为O(1)。也许大家注意到,content的类型是int8_t,但实际上content数组并不保存任何int8_t类型的值,真正的类型取决于第一个属性:encoding。如果encoding属性值为INTSET_ENC_INT16,那么,content就是一个int16_t类型的数组数组里的每一项都是int16_t类型的值,同理,content也可能是int32_t、int64_t类型的数组(保存的值得范围不同),这取决于集合存储多大的值。
当我们向一个使用intset编码的集合中添加一个新的整数值时,可能会触发升级操作。这里说的升级指的就是content里元素的升级,简单的说,因为content本身是个数组,只能有一个类型,如果说当前数组的所有元素都是int16_t类型的值,这时向集合中添加一个需要int32_t类型才能保存的值,就会触发升级操作,分为三个步骤进行:1、根据新元素的类型,扩展数组的空间大小,并分配空间;2、将数组内现有所有元素都转换成新元素的类型;3、将新元素添加。这种升级策略好处是满足存储要求的同时节约了内存的使用。虽然,固定使用int64_t类型的数组也能满足要求,但是,一般情况而言,一个集合中的数据应该是相似的,很少出现数据差距如此之大的情况。如果一个集合中的数据值都比较小,int16_t类型完全够用,那么使用int64_t类型就非常的浪费空间。
既然有升级,那是不是有降级操作呢?答案是没有!一旦升级之后,就无法降级了。
(2)哈希表hashtable
关于哈希表,在我介绍哈希类型的文章中介绍过,感兴趣的朋友可以点击文章底部的链接查看。
需要在这里说明的是,因为hashtable本身是键值对结构,而集合中元素只是单一元素,那么集合如何使用hashtable来实现呢?实际上,集合只使用了hashtable的键,也就是说使用hashtable编码的集合,集合元素就是hashtable的键,而其对应的值全都设置为了NULL。
常用命令
集合的命令包括两个方面,集合内命令和集合间命令。
(1)集合内命令
sadd:添加元素命令,可以一次添加多个元素,重复添加元素将被忽略。同时也看到,当集合元素是数值和字符串时,集合的底层编码是不同的。
srem:删除元素命令,可以同时指定多个元素,执行返回的是成功删除的元素的个数;
scard:统计元素个数的命令,返回集合元素个数,时间复杂度为O(1),因为不管底层编码是intset还是hashtable,结构本身都有变量保存元素个数或者集合长度;
sismember:判断元素是否在集合内的命令,存在返回1不存在返回0;
srandmember:随机返回一个元素的命令,可以指定返回的个数,不指定默认为1;
spop:随机弹出指定个数的元素的命令,不指定个数默认为1个,该命令和srandmember的区别是,spop之后,元素从集合中删除;
smembers:获取集合所有元素的命令,需要注意的是,smembers和哈希的hgetall命令类似,当元素过多时,可能导致服务阻塞,产生性能问题,所以谨慎使用。
(2)集合间命令
集合间命令包含交集、并集、差集,以及将结果生成新集合。
sinter、sunion、sdiff分别返回多个(包含一个)集合的交集、并集、差集,在命令后边+store即可将结果保存在新的集合中。需要注意的是sdiff命令,计算差集时参数的顺序和返回内容有关。
典型应用场景
集合类型最典型的应用就是标签(tag)。大家可能对推荐比较熟悉,推荐的原理就是把推荐的内容分类,当你对分类中的某一种或者某几种感兴趣的时候,推荐系统就会把相同分类的其他内容推荐给你。打标签其实就是分类,比如你对娱乐、体育感兴趣,另一个用户对历史、新闻比较感兴趣,这些兴趣就是标签,有了这些标签,就可以知道哪些人喜好相同,从而增加用户的黏度。
集合还有一个应用场景就是随机抽奖,就是用到spop/srandmember命令,通过随机返回,生成随机数进行抽奖。
相关推荐
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
-
在企业级运维、故障排查和性能调优过程中,准确了解服务器的运行环境至关重要。无论是物理机还是虚拟机,都存在各自的优势与限制。在很多场景下,尤其是当你继承一台服务器而不清楚底层硬件细节时,如何快速辨识它是...
- 第四节 Windows 系统 Docker 安装全指南
-
一、Docker在Windows上的运行原理(一)架构限制说明Docker本质上依赖Linux内核特性(如Namespaces、Cgroups等),因此在Windows系统上无法直...
- C++ std:shared_ptr自定义allocator引入内存池
-
当C++项目里做了大量的动态内存分配与释放,可能会导致内存碎片,使系统性能降低。当动态内存分配的开销变得不容忽视时,一种解决办法是一次从操作系统分配一块大的静态内存作为内存池进行手动管理,堆对象内存分...
- Activiti 8.0.0 发布,业务流程管理与工作流系统
-
Activiti8.0.0现已发布。Activiti是一个业务流程管理(BPM)和工作流系统,适用于开发人员和系统管理员。其核心是超快速、稳定的BPMN2流程引擎。Activiti可以...
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
-
MyBatis动态SQL在日常开发中频繁使用,但大多数开发者仅掌握基础标签。本文将介绍五种高阶技巧,助你解锁更灵活的SQL控制能力。一、智能修剪(Trim标签)应用场景:动态处理字段更新,替代<...
- Springboot数据访问(整合Mybatis Plus)
-
Springboot整合MybatisPlus1、创建数据表2、引入maven依赖mybatis-plus-boot-starter主要引入这个依赖,其他相关的依赖在这里就不写了。3、项目结构目录h...
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
-
见证了两个月前勇士与猛龙那个史诗般的系列赛后,甲骨文球馆正式成为了历史。那个大大的红色标志被一个字母一个字母地移除,在周四,一切都成为了过去式。然而这座,别名为“Roaracle”(译注:Roar怒吼...
- Mybatis入门看这一篇就够了(mybatis快速入门)
-
什么是MyBatisMyBatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwarefoundation迁移到了googlecode,并且改名为M...
- Springboot数据访问(整合druid数据源)
-
Springboot整合druid数据源基本概念SpringBoot默认的数据源是:2.0之前:org.apache.tomcat.jdbc.pool.DataSource2.0及之后:com.z...
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
-
什么是/etc/profile.d/目录?/etc/profile.d/目录是Linux系统不可或缺的一部分保留配置脚本。它与/etc/profile文件相关联,这是一个启动脚本,该脚...
- 企业数据库安全管理规范(企业数据库安全管理规范最新版)
-
1.目的为规范数据库系统安全使用活动,降低因使用不当而带来的安全风险,保障数据库系统及相关应用系统的安全,特制定本数据库安全管理规范。2.适用范围本规范中所定义的数据管理内容,特指存放在信息系统数据库...
- Oracle 伪列!这些隐藏用法你都知道吗?
-
在Oracle数据库中,有几位特殊的“成员”——伪列,它们虽然不是表中真实存在的物理列,但却能在数据查询、处理过程中发挥出意想不到的强大作用。今天给大家分享Oracle伪列的使用技巧,无论...
- Oracle 高效处理数据的隐藏神器:临时表妙用
-
各位数据库搬砖人,在Oracle的代码世界里闯荡,处理复杂业务时,是不是总被数据“搅得头大”?今天给大家安利一个超实用的隐藏神器——临时表!当你需要临时存储中间计算结果,又不想污染正式数据表...
- Oracle 数据库查询:多表查询(oracle多表关联查询)
-
一、多表查询基础1.JOIN操作-INNERJOIN:返回两个表中满足连接条件的匹配行,不保留未匹配数据。SELECTa.emp_id,b.dept_nameFROMempl...
- 一文掌握怎么利用Shell+Python实现多数据源的异地备份程序
-
简介:在信息化时代,数据安全和业务连续性已成为企业和个人用户关注的焦点。无论是网站数据、数据库、日志文件,还是用户上传的文档、图片等,数据一旦丢失,损失难以估量。尤其是当数据分布在多个不同的目录、服务...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
- 第四节 Windows 系统 Docker 安装全指南
- C++ std:shared_ptr自定义allocator引入内存池
- Activiti 8.0.0 发布,业务流程管理与工作流系统
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
- Springboot数据访问(整合Mybatis Plus)
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
- Mybatis入门看这一篇就够了(mybatis快速入门)
- Springboot数据访问(整合druid数据源)
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
- 标签列表
-
- oracle位图索引 (74)
- oracle基目录 (50)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (53)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)