Redis 缓存雪崩、穿透、击穿怎么解决?
mhr18 2025-03-28 18:29 26 浏览 0 评论
Redis 缓存雪崩、穿透和击穿是缓存使用中常见的三个问题,它们都可能导致数据库压力骤增,甚至系统崩溃。下面分别解释这三个问题的原因、危害以及相应的解决方案。
1. 缓存雪崩 (Cache Avalanche)
问题描述:
缓存雪崩是指在某一时刻,缓存中大量的 Key 同时过期失效,导致大量的请求直接穿透缓存,全部打到数据库上,造成数据库压力瞬间增大,甚至宕机。就像雪崩一样,一旦发生,后果严重。
原因:
- 大量 Key 设置了相同的过期时间: 这是最常见的原因。例如,在某个时间点,批量导入的数据设置了相同的过期时间,导致它们在同一时刻失效。
- 缓存服务宕机: 如果 Redis 集群发生故障,导致缓存服务不可用,所有请求都会直接打到数据库。
- 热点数据集中过期: 虽然不是所有 Key 都过期,但如果大量热点数据 Key 在同一时间过期,也会造成类似雪崩的效果。
危害:
- 数据库压力骤增: 大量请求直接访问数据库,可能导致数据库连接耗尽、性能下降甚至宕机。
- 系统崩溃: 数据库宕机可能导致整个系统崩溃,影响用户体验。
- 服务不可用: 系统崩溃或数据库压力过大,会导致服务不可用。
解决方案:
- 过期时间打散 (设置随机过期时间):
- 原理: 在设置缓存 Key 的过期时间时,加上一个随机值,避免大量的 Key 在同一时刻过期。
- 实现: 例如,如果原本设置过期时间为 1 小时,可以改为 1 小时 ± 随机几分钟。
- 代码示例 (Java):
- java复制代码
- long expireTime = 60 * 60; // 1 小时 long randomTime = new Random().nextInt(60 * 5); // 随机 0-5 分钟 redisTemplate.expire(key, expireTime + randomTime, TimeUnit.SECONDS);
- 互斥锁 (Mutex) 或分布式锁:
- 原理: 当缓存失效时,只允许一个请求去重建缓存,其他请求等待重建完成,避免大量请求同时穿透缓存。
- 实现: 可以使用 Redis 的 SETNX 命令实现分布式锁。
- 流程:请求到达,查询缓存,如果缓存失效。尝试获取分布式锁 (例如 SETNX key_lock value NX PX 5000)。如果获取锁成功,则从数据库加载数据,重建缓存,释放锁。如果获取锁失败,则等待一段时间 (例如几毫秒) 后重试查询缓存。
- 注意: 需要设置锁的过期时间,防止死锁。
- 缓存预热 (Cache Preheating):
- 原理: 在系统启动或低峰期,提前将热点数据加载到缓存中,避免在高峰期缓存失效导致雪崩。
- 实现: 可以使用定时任务、监控系统等方式,定期加载或更新缓存。
- 场景: 适用于已知热点数据且数据更新频率不高的情况。
- 双层缓存 (Multi-Level Cache):
- 原理: 使用多级缓存,例如本地缓存 (如 Caffeine) + Redis 缓存。当 Redis 缓存失效时,先从本地缓存获取数据,本地缓存也失效时才穿透到数据库。
- 实现: 可以使用 Caffeine、Guava Cache 等本地缓存库。
- 优点: 本地缓存速度更快,可以有效缓解 Redis 缓存失效带来的冲击。
- 缺点: 本地缓存容量有限,数据一致性需要考虑。
- 服务降级 (Service Degradation) 或限流 (Rate Limiting):
- 原理: 当检测到缓存雪崩可能发生时,对部分请求进行降级处理 (例如返回默认值、错误页) 或限流,保护数据库。
- 实现: 可以使用熔断器、限流组件 (如 Sentinel、Guava RateLimiter) 等。
- 场景: 作为最后的保护手段,牺牲部分用户体验来保证系统整体可用性。
2. 缓存穿透 (Cache Penetration)
问题描述:
缓存穿透是指请求查询的 Key 在缓存和数据库中都不存在,导致每次请求都穿透缓存,直接打到数据库。由于数据库也查不到数据,每次请求都会无效查询数据库,浪费资源,在高并发情况下可能导致数据库压力过大。
原因:
- 恶意攻击: 攻击者故意构造大量不存在的 Key 进行请求,试图绕过缓存,直接攻击数据库。
- 业务误操作: 程序 Bug 导致查询不存在的 Key。
- 数据清理不彻底: 数据库中数据被删除,但缓存中没有同步清理,导致缓存中不存在,数据库也不存在。
危害:
- 数据库压力增大: 大量无效请求直接访问数据库,浪费数据库资源。
- 性能下降: 数据库处理无效请求会消耗资源,影响正常请求的处理速度。
- 安全风险: 可能被恶意利用进行 DDoS 攻击。
解决方案:
- 缓存空值 (Cache Null Values):原理: 当数据库查询结果为空时,仍然将空值 (例如 null 或特殊标记) 缓存到 Redis 中,并设置一个较短的过期时间 (例如几秒或几分钟)。下次请求相同的 Key 时,直接从缓存中返回空值,避免穿透到数据库。实现: 判断数据库查询结果是否为空,如果为空则将空值存入 Redis。代码示例 (Java):
- java复制代码
String value = redisTemplate.opsForValue().get(key); if (value != null) { return value; }
value = databaseService.query(key);
if (value == null) {
redisTemplate.opsForValue().set(key, "null", 60, TimeUnit.SECONDS); // 缓存空值,过期时间 60 秒
return null; // 返回 null 或其他表示空值的标记
} else {
redisTemplate.opsForValue().set(key, value, expireTime, TimeUnit.SECONDS);
return value;
}
```
* **注意:** 空值的过期时间不宜过长,避免缓存脏数据。
- 布隆过滤器 (Bloom Filter):
- 原理: 在缓存之前设置一个布隆过滤器,将所有存在的 Key 预先加载到布隆过滤器中。当请求到达时,先通过布隆过滤器判断 Key 是否可能存在,如果布隆过滤器判断 Key 不存在,则直接返回,避免查询缓存和数据库。
- 实现: 可以使用 Redis 的布隆过滤器模块 (RedisBloom) 或其他布隆过滤器库 (如 Guava BloomFilter)。
- 优点: 高效判断 Key 是否可能存在,误判率可控。
- 缺点: 存在误判率 (False Positive),即布隆过滤器判断 Key 存在,但实际可能不存在。不适合需要精确判断 Key 是否存在的情况。
- 输入校验 (Input Validation):
- 原理: 在请求入口处进行参数校验,过滤掉非法参数,例如 Key 的格式、类型等,防止恶意请求穿透缓存。
- 实现: 可以使用正则表达式、数据类型校验等方式进行参数校验。
- 场景: 适用于可以预知 Key 的格式和类型的情况。
- 限流 (Rate Limiting):
- 原理: 对请求进行限流,限制单位时间内请求的数量,防止恶意请求大量穿透缓存。
- 实现: 可以使用限流组件 (如 Sentinel、Guava RateLimiter) 等。
- 场景: 作为一种保护措施,防止恶意攻击。
3. 缓存击穿 (Cache Breakdown / Hotspot Key)
问题描述:
缓存击穿是指一个热点 Key (访问频率非常高的 Key) 在缓存中过期失效,导致大量请求同时穿透缓存,直接打到数据库,瞬间给数据库带来巨大的压力。与雪崩不同的是,击穿是针对单个热点 Key,而雪崩是大量 Key。
原因:
- 热点 Key 过期: 热点 Key 设置了过期时间,并在高并发访问时过期。
- 热点 Key 被手动删除: 运维人员或程序误操作删除了热点 Key。
危害:
- 数据库压力骤增: 大量请求同时访问数据库的热点数据,可能导致数据库压力过大,甚至宕机。
- 性能下降: 数据库处理大量请求会消耗资源,影响其他请求的处理速度。
- 服务不稳定: 数据库压力过大可能导致服务不稳定。
解决方案:
- 互斥锁 (Mutex) 或分布式锁 (与雪崩解决方案类似):
- 原理: 当热点 Key 缓存失效时,只允许一个请求去重建缓存,其他请求等待重建完成,避免大量请求同时穿透缓存。
- 实现: 与缓存雪崩的互斥锁方案类似,可以使用 Redis 的 SETNX 命令实现分布式锁。
- 流程:请求到达,查询缓存,如果热点 Key 缓存失效。尝试获取分布式锁 (例如 SETNX hot_key_lock value NX PX 5000)。如果获取锁成功,则从数据库加载热点数据,重建缓存,释放锁。如果获取锁失败,则等待一段时间 (例如几毫秒) 后重试查询缓存。
- “永不过期” (逻辑过期) 或设置较长的过期时间:
- 原理: 对于热点 Key,可以设置永不过期 (不设置过期时间) 或设置一个非常长的过期时间,避免热点 Key 过期导致击穿。
- 实现: 设置 Redis Key 时不设置过期时间,或者设置一个很长的过期时间。
- 数据更新: 如果热点数据需要更新,可以在后台异步更新缓存,或者使用逻辑过期的方式。
- 逻辑过期: 缓存中存储的数据除了实际值,还包含一个过期时间戳。程序在读取缓存时,判断当前时间是否超过过期时间戳,如果超过则异步更新缓存,但仍然返回旧值,保证服务可用性。
- 热点 Key 复制多份:
- 原理: 将热点 Key 复制多份,分散请求压力,降低单个 Key 的访问频率。
- 实现: 可以使用不同的 Key 前缀或后缀来区分不同的副本。
- 场景: 适用于热点 Key 的数据量不大,可以复制多份的情况。
- 本地缓存 (Local Cache) + Redis 缓存 (与雪崩解决方案类似):
- 原理: 在 Redis 缓存前增加一层本地缓存 (如 Caffeine)。热点 Key 优先从本地缓存获取,本地缓存失效时再穿透到 Redis 缓存,Redis 缓存失效时才穿透到数据库。
- 实现: 可以使用 Caffeine、Guava Cache 等本地缓存库。
- 优点: 本地缓存速度更快,可以有效缓解热点 Key 击穿带来的冲击。
- 缺点: 本地缓存容量有限,数据一致性需要考虑。
通用最佳实践:
- 监控和预警: 建立完善的缓存监控体系,监控缓存命中率、过期 Key 数量、数据库负载等指标,及时发现异常情况并预警。
- 合理的缓存策略: 根据业务场景选择合适的缓存策略,包括过期时间设置、缓存更新策略、缓存淘汰策略等。
- 压力测试: 在上线前进行充分的压力测试,模拟高并发场景,验证缓存系统的稳定性,并及时调整缓存策略和容量。
- 多级缓存架构: 考虑使用多级缓存架构,例如本地缓存 + Redis 缓存,提高缓存的性能和稳定性。
- 服务降级和限流: 作为最后的保护手段,在系统出现异常时,可以进行服务降级或限流,保证核心服务的可用性。
总结:
缓存雪崩、穿透和击穿是缓存使用中常见的问题,需要根据具体场景选择合适的解决方案。理解这些问题的原理和解决方案,可以帮助我们更好地设计和维护缓存系统,提高系统的性能和稳定性。 重要的是要结合实际业务场景,综合考虑各种方案的优缺点,选择最适合的解决方案。
相关推荐
- 【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库
-
如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...
- Pure Storage推出统一数据管理云平台及新闪存阵列
-
PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...
- 对Java学习的10条建议(对java课程的建议)
-
不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...
- SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!
-
官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...
- JDK21有没有什么稳定、简单又强势的特性?
-
佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...
- 「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了
-
在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...
- Java面试题及答案最全总结(2025版)
-
大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...
- 数据库日常运维工作内容(数据库日常运维 工作内容)
-
#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...
- 分布式之系统底层原理(上)(底层分布式技术)
-
作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...
- oracle 死锁了怎么办?kill 进程 直接上干货
-
1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...
- SpringBoot 各种分页查询方式详解(全网最全)
-
一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...
- 《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略
-
《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...
- LoadRunner(loadrunner录制不到脚本)
-
一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...
- Redis数据类型介绍(redis 数据类型)
-
介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...
- RMAN备份监控及优化总结(rman备份原理)
-
今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)