记一次redis命令超时问题处理及思考
mhr18 2024-10-25 12:36 59 浏览 0 评论
摘要:
本文详细描述redis命令超时问题分析处理过程,并对此问题原因进行了详细分析,最终找到根因并制定解决方案恢复系统正常。
通过总结本次案例遇到的问题,为其他应用系统故障排除提供参考,并思考总结了运维工作中需要改进的地方。
关键词:redis 超时 内存
案例正文:
1、 背景Situation
Redis是我们应用系统常见的一种开源中间件,常用于做数据缓存、保持会话链接等方面。A系统也使用redis,把热点数据存储在其中,加快数据返回的速度,从而提升用户体验。Redis 为cluster集群模式部署,三个节点,应用系统中各个应用都共用一套redis,应用与redis的调用关系如下:
2、 事件描述及问题Task
2024年7月19日,移动门户业务群中反馈A系统的某个功能使用起来特别的慢,而且不是个例,由于我们这个功能需要连接阿里云,经验证排除现地网络限制,确认应用确实出现问题。
3、 分析与对策Action
3.1、故障定位
根据用户功能反馈描述以及系统架构,定位为APP2引起的故障。
- 登录zabbix监控系统,查看APP2的cpu、内存关键性能指标等信息,发现一切正常,排除由于资源不足导致应用性能下降。
- 查看应用日志,通过日志发现有报错信息,报错如图3-1,看字面意思,是由于执行了redis的命令,长时间未返回导致超时,那现在问题又到了redis。
- 查看redis相关信息,集群没有宕机过(图3-2),CPU、内存使用正常(图3-3 3-4),也没有到达最大链接数(图3-5),最大链接数默认10000。
- 由于应用报错redis的问题,那通过日志继续排查,最终终于看到了一丝迹象:output buffer limits。
- 由于其他app也连接redis,功能正常。那基本确认app2 在使用redis时导致故障。
3.2、根因分析
对于Redis服务器命令的返回,其大小一般是不可控制的。有可能一个非常简单的指令,就能够产生体积庞大的返回数据量。另外也有可能因为执行了太多指令,导致产生返回数据的速率超过了往客户端发送的速率,这是也会导致服务器堆积大量消息,从而导致输出缓冲区越来越大,占用过多内存,以至于导致系统崩溃。
万幸的是Redis设置了一些保护机制来避免这种情况的出现,不同类型的客户端有不同的限制参数。限制方式有如下两种:
? 大小限制,当某一个客户端的缓冲区超过某一个大小值时,直接关闭这个客户端的连接;
? 持续性限制,当某一个客户端的缓冲区持续一段时间占用过大空间时,会直接关闭客户端连接。
配置文件关于客户端输出缓冲区的配置如下:
后面三个参数分别表示 最大限制 最小限制 最小限制的持续时间,不同客户端有不同策略,策略如下:
对于普通客户端来说,限制为0,也就是不限制。因为普通客户端通常采用阻塞式的消息应答模式,何谓阻塞式呢?如:发送请求,等待返回,再发送请求,再等待返回。这种模式下,通常不会导致Redis服务器输出缓冲区的堆积膨胀;
对于Pub/Sub客户端(也就是发布/订阅模式),大小限制是8M,当输出缓冲区超过8M时,会关闭连接。持续性限制是,当客户端缓冲区大小持续60秒超过2M,则关闭客户端连接;
对于slave客户端来说,大小限制是256M,持续性限制是当客户端缓冲区大小持续60秒超过64M,则关闭客户端连接。
本次故障很显然是app2应用触发了redis返回数据的大小限制,从而导致超时。
3.3、故障解决方案
临时修改redis配置,加大返回数据限制的数值。
4、 处理结果Result
- 通过命令,临时加大返回数据限制的数值,未写入配置文件,redis重启后失效;
- 优化APP2应用,减少数据的返回;
- 待应用优化上线后,通过命令,改回redis默认配置。
5、 建议与讨论Review
本次问题主要是应用请求数据过大,触发了redis的限制导致。在此也是跟我们提了个醒,在使用redis的时候应该遵循以下规则:
- 合理选择数据类型:
Redis 提供了多种数据结构,如字符串(string)、哈希(hash)、列表(list)、集合(set)、有序集合(sorted set)等。根据实际需求选择合适的数据结构可以提高存储效率和操作性能。例如,如果要存储对象,可以考虑使用哈希结构,将对象的属性作为哈希的字段进行存储;如果要实现消息队列,可以使用列表结构。
- 避免过度使用复杂数据结构
虽然 Redis 提供了丰富的数据结构,但过度使用复杂的数据结构可能会导致性能下降。在设计数据存储方案时,尽量保持数据结构的简洁性。例如,如果只需要存储简单的键值对,可以优先考虑使用字符串类型,而不是使用哈希结构来存储单个属性的键值对
- 定期清理过期数据
如果存储的数据设置了过期时间,Redis 会自动删除过期的数据。但是,如果过期数据较多,可能会影响性能。
- 避免存储大对象
尽量避免在 Redis 中存储大对象,因为大对象会占用较多的内存空间,并且在进行数据操作时可能会导致性能问题。如果需要存储大对象,可以考虑将其存储在外部存储系统中,如文件系统或数据库,并在 Redis 中存储对象的引用。
- 优化命令执行
在执行 Redis 命令时,尽量减少命令的执行次数和数据传输量。可以使用批量操作命令,如MSET、MGET等,一次性执行多个命令;可以使用PIPELINE命令将多个命令打包成一个请求发送给 Redis,减少网络开销。同时,避免在 Redis 中执行复杂的计算操作,如排序、聚合等,可以将这些操作在应用程序中进行,以提高性
相关推荐
- 【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库
-
如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...
- Pure Storage推出统一数据管理云平台及新闪存阵列
-
PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...
- 对Java学习的10条建议(对java课程的建议)
-
不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...
- SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!
-
官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...
- JDK21有没有什么稳定、简单又强势的特性?
-
佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...
- 「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了
-
在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...
- Java面试题及答案最全总结(2025版)
-
大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...
- 数据库日常运维工作内容(数据库日常运维 工作内容)
-
#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...
- 分布式之系统底层原理(上)(底层分布式技术)
-
作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...
- oracle 死锁了怎么办?kill 进程 直接上干货
-
1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...
- SpringBoot 各种分页查询方式详解(全网最全)
-
一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...
- 《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略
-
《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...
- LoadRunner(loadrunner录制不到脚本)
-
一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...
- Redis数据类型介绍(redis 数据类型)
-
介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...
- RMAN备份监控及优化总结(rman备份原理)
-
今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)