记一次Redis scard读取数据结果不对的问题「DaemonCoder」
mhr18 2024-11-30 12:33 22 浏览 0 评论
今天在用Redis时遇到一个奇怪的问题,虽然很快就定位到了问题,但是在开发时确实忽略了,还是意识不到位,这里记录一下问题的来龙去脉让自己铭记。
背景
首先介绍一下背景,在一个类似抢票的项目中,其中有一步是需要把奖品数据存放在Redis的一个集合(Set)中,中奖时通过SPOP命名从集合中取出一个奖品。这个奖品集合的数据在开始抢票之前生成,放在了一个脚本中去做,问题就出现在了这个脚本。
奖品数据生成脚本
上面我们说的脚本要做的工作无非就是:
1. 读出全部的奖品
2. 分批把奖品存入Redis的一个Set中(考虑奖品过多,没有一次把全部存入,做了分批处理)
这么看脚本很简单,没有什么复杂的逻辑,但是需要确保全部奖品都写入Redis成功,不能只写入部分奖品。如果有失败,需要进行重试或者报警。
下面直接看下代码,代码用世界上最好的PHP语言,Redis客户端用的phpredis。
代码中 RedisUtil::getInstance() 是一个封装过的Redis工具类,里面封装了获取redis连接、自动选择主从库等操作。$objRedis->sAddArray() 把奖品数据分批写入,最后通过$objRedis->sCard()来判断是否全部成功写入,有失败的话需要返回给上层调用的地方,进行重试或者报警处理。
问题的表现
上面的代码实在太简单,一顿操作就把代码写完了,然后开心地去测试,没问题。不过为了稳妥,还是设置了重试一定次数,依然执行失败就邮件报警,万事具备,不可能再有问题了,上线!然后,就翻车了!喜获报警邮件一份!
经过多次在测试发现不稳定,大多数情况可能成功执行,但是有很小的概率会失败。问题是失败的情况下,并不是因为写Redis失败。从输出的数据看,失败的时候也成功执行了写入操作,而且sCard()操作也成功执行,就是得到的数据不对。
问题的定位
手动清除原有数据,重新执行脚本,问题复现之后,查看输出,一切正常,只有sCard()返回的数据不对,还手动查了下当时集合中写入的数据,确实成功写入了,所以问题就锁定在了sCard()方法。
查了下Redis SCARD命令的官方文档:https://redis.io/commands/scard,先确认自己的没有用错。命令功能很简单,没有什么特别的地方,就是返回集合中的元素数量,如果key不存在,返回0。
难不成redis的scard命令有bug不成?兴奋之际,再单独执行了一下sCard(),这次结果竟然对了,这么看,问题不在sCard(),大概可以猜到问题的原因是出在了数据延时的问题。就是说之前通过sAddArray()写入集合的数据,有部分还没有生效。Redis本身用单线程处理请求,理论不应该存在出现这种延时,但是线上环境的Redis往往都是主从结构的,主库到从库同步数据是会有延时的,这也是出现这个问题的真实的原因。
上述代码中用RedisUtil::getInstance()来获取redis示例,前面也有介绍,这个是我们自己封装的Redis工具类,会根据不同的redis命令做读写分离。sAddArray()是一个写请求,会自动选择主库连接执行,而sCard()是一个读请求,默认会选择从库去执行。所以会出现用sCard()读取不到集合真实的大小,因为从库此时可能还没有同步到最新的数据。
解决方案
调整代码,强制让sCard()方法选择主库(每个人连接的Redis工具类不同,这里不再贴代码,大概的方式就是连接时指定主库的IP)。这样经过多次反复测试,没有再出现这个问题。
一些反思
为什么上线前测试的时候没有发现这个问题?
部分原因是问题出现的概率比较小,还有更重要的一个原因,是我们线下测试环境的Redis就只有一个库!没有那么多资源去给测试环境做个主从,最根本的原因可能还是因为穷(囧)。我想应该有不少公司和我们一样的,所以希望这个问题对你也有帮助。
不仅仅是主从延时的问题不易发现,如果线上Redis有多台机器,选择机器连接出错的问题也不易发现。
用一个比较常见的场景为例,存储用户的数据时,往往根据用户的ID做哈希,分布存储在多台机器上,如果代码有bug计算哈希值时用错了值,就有可能选择错误的机器。如果恰好你和我们一样,测试环境只有可怜的一台机器,那么测试阶段可能发现不了这个问题,细思极恐有木有。
为什么开发时没有考虑到会有主从延时的问题?
这个确实要从自己找原因了,还要把提高自己的主从意识。不仅仅是这种场景要考虑主从,从Redis中读任何数据时,都要第一时间想到读到可能不是最新数据。也不仅仅是Redis,MySQL等其他主从结构数据库,也都要第一时间想到主从延时。
访问 daemoncoder.com 发现更多优质内容。
相关推荐
- Spring Boot 分布式事务实现简单得超乎想象
-
环境:SpringBoot2.7.18+Atomikos4.x+MySQL5.71.简介关于什么是分布式事务,本文不做介绍。有需要了解的自行查找相关的资料。本篇文章将基于SpringBoot...
- Qt编写可视化大屏电子看板系统15-曲线面积图
-
##一、前言曲线面积图其实就是在曲线图上增加了颜色填充,单纯的曲线可能就只有线条以及数据点,面积图则需要从坐标轴的左下角和右下角联合曲线形成完整的封闭区域路径,然后对这个路径进行颜色填充,为了更美观...
- Doris大数据AI可视化管理工具SelectDB Studio重磅发布!
-
一、初识SelectDBStudioSelectDBStudio是专为ApacheDoris湖仓一体典型场景实战及其兼容数据库量身打造的GUI工具,简化数据开发与管理。二、Select...
- RAD Studio 、Delphi或C++Builder设计代码编译上线缩短开发时间
-
#春日生活打卡季#本月,Embarcadero宣布RADStudio12.3Athens以及Delphi12.3和C++Builder12.3,提供下载。RADStudio12.3A...
- Mybatis Plus框架学习指南-第三节内容
-
自动填充字段基本概念MyBatis-Plus提供了一个便捷的自动填充功能,用于在插入或更新数据时自动填充某些字段,如创建时间、更新时间等。原理自动填充功能通过实现com.baomidou.myba...
- 「数据库」Sysbench 数据库压力测试工具
-
sysbench是一个开源的、模块化的、跨平台的多线程性能测试工具,可以用来进行CPU、内存、磁盘I/O、线程、数据库的性能测试。目前支持的数据库有MySQL、Oracle和PostgreSQL。以...
- 如何选择适合公司的ERP(选erp系统的经验之谈)
-
很多中小公司想搞ERP,但不得要领。上ERP的目的都是歪的,如提高效率,减少人员,堵住财务漏洞等等。真正用ERP的目的是借机提升企业管理能力,找出管理上的问题并解决,使企业管理更规范以及标准化。上ER...
- Manus放开注册,但Flowith才是Agent领域真正的yyds
-
大家好,我是运营黑客。前天,AIAgent领域的当红炸子鸡—Manus宣布全面放开注册,终于,不需要邀请码就能体验了。于是,赶紧找了个小号去确认一下。然后,额……就被墙在了外面。官方解释:中文版...
- 歌浓酒庄总酿酒师:我们有最好的葡萄园和最棒的酿酒师
-
中新网1月23日电1月18日,张裕董事长周洪江及总经理孙健一行在澳大利亚阿德莱德,完成了歌浓酒庄股权交割签约仪式,这也意味着张裕全球布局基本成型。歌浓:澳大利亚年度最佳酒庄据悉,此次张裕收购的...
- 软件测试进阶之自动化测试——python+appium实例
-
扼要:1、了解python+appium进行APP的自动化测试实例;2、能根据实例进行实训操作;本课程主要讲述用python+appium对APP进行UI自动化测试的例子。appium支持Androi...
- 为什么说Python是最伟大的语言?看图就知道了
-
来源:麦叔编程作者:麦叔测试一下你的分析能力,直接上图,自己判断一下为什么Python是最好的语言?1.有图有真相Java之父-JamesGoshlingC++之父-BjarneStrou...
- 如何在Eclipse中配置Python开发环境?
-
Eclipse是著名的跨平台集成开发环境(IDE),最初主要用来Java语言开发。但是我们通过安装不同的插件Eclipse可以支持不同的计算机语言。比如说,我们可以通过安装PyDev插件,使Eclip...
- 联合国岗位上新啦(联合国的岗位)
-
联合国人权事务高级专员办事处PostingTitleIntern-HumanRightsDutyStationBANGKOKDeadlineOct7,2025CategoryandL...
- 一周安全漫谈丨工信部:拟定超1亿条一般数据泄露属后果严重情节
-
工信部:拟定超1亿条一般数据泄露属后果严重情节11月23日,工信部官网公布《工业和信息化领域数据安全行政处罚裁量指引(试行)(征求意见稿)》。《裁量指引》征求意见稿明确了行政处罚由违法行为发生地管辖、...
- oracle列转行以及C#执行语句时报错问题
-
oracle列转行的关键字:UNPIVOT,经常查到的怎么样转一列,多列怎么转呢,直接上代码(sshwomeyourcode):SELECTsee_no,diag_no,diag_code,...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle 空为0 (51)
- oracle主从同步 (56)
- oracle 乐观锁 (53)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)