Java性能优化指南—缓存那些事
mhr18 2025-05-30 16:22 5 浏览 0 评论
由于笔者自身水平有限,如果有不对或者任何建议欢迎批评和指正
本文预计阅读时间10分钟,分为前言、填坑两部分,主要包含缓存的基本使用到高级应用场景的介绍
一、前言
在处理高并发请求时,缓存几乎是无往不利的利器。举个例子,在下图中有两个请求:请求1命中缓存,总耗时= 网络耗时t1 + 缓存数据获取t2,请求2总耗时 = 网络耗时 t1 + 缓存数据获取t3。t3-t2就是缓存带来的性能提升。实际业务场景中,查询一次DB需要耗时20ms,读取一次缓存耗时1ms,那么就节省了19ms。
从实际的场景出发,可以将缓存的使用分为两大类:
1. 使用更快的存储介质替代慢的,减少数据访问时间,比如内存替代磁盘
2. 缓存计算结果,节省计算资源,比如缓存DB查询结果
对于第一类使用方式,可能不是特别直观,我们看下数据
从上图可以看到,最快的一级缓存到最慢的网络读写之间差了3亿倍。
第二类比较好理解,从开篇举的例子就能看出,计算消耗的资源越多,缓存的效果就越明显。
通常这两类使用方式结合,能达到优化响应,节省计算资源,降低后端负载的目的。但是有利就有弊,相对于他的巨大好处,带来的弊端也是巨大的,甚至某些场景并不适合缓存。
1. 数据不一致性。无论多么好的设计,缓存数据与真实数据源一定存在着一定时间窗口,这段时间内数据是不一致的
2. 代码维护成本。有缓存后,代码就会在原数据源基础上加入缓存的相关代码,例如某数据存储在DB中,通过sql进行查询,现在需要同步设计一套缓存的存储、同步、使用的代码。必然增加代码工作量和系统架构的复杂度
二、填坑
在缓存带来的高收益面前,也会有很多的坑,主要下面几类
2.1 缓存一致性
当数据时效性要求很高时,需要保证缓存与数据源的数据保持一致,不能存在差异。因为数据存在两个地方,理论上不可能达到100%的一致,只能尽可能的较少不一致的时间窗口。这依赖于缓存的更新策略。一般有两大类:主动更新和被动更新。
2.1.1 主动更新
- 监听数据变更事件,一旦发生变更,则主动更新缓存
- 定时刷新缓存数据
2.1.2 被动更新
- 设置缓存过期时间,查询缓存时发现过期,则重新获取数据,并且写入到缓存中
对于一致性解决方案,目前没有统一标准,通过上面的策略调整,可以尽可能的缩短不一致的窗口期,达到最终一致,在业务可接受范围时间内的不一致性,都是认为可接受的。
2.2 缓存击穿
这里要区分一下击穿与雪崩的差别,击穿指一个“热点”Key失效导致大量相同请求打到后端,雪崩则是大量的Key同时失效。明确概念,解决起来就简单多了。
2.2.1 相同请求合并
设置互斥锁,保证缓存过期之后,只有一个请求查询DB,更新缓存,其他请求则不断轮训DB,等待处理。伪代码如下:
public Object get(String key) {
Object value = getFromCache(key);
if (value != null) {
return value;
}
if (tryLock()) {
value = queryAndUpdateCache(key);
releaseLock();
} else {
sleep(10L);
value = get(key);
}
return value;
}
2.2.2 提前触发更新
在Value内部设置一个过期时间timeout1,缓存的时间过期时间为timeout2,在获取Key的时候,检查一下timeout1,已经过期,则触发缓存更新。
2.2.3 永不过期
这里的永不过期,是指物理上永不过期,但是设置一个逻辑过期时间。该方案相对“提前触发更新”,会占据更多的存储空间,但是不会存在缓存失效问题。
2.3 缓存穿透
缓存穿透是指查询一个一定不存在的数据时,由于缓存肯定不会命中,每次请求都会由后端处理,实际又不会更新。针对这种情况,一般有两种方案
2.3.1 缓存空值
将value为空的也缓存起来,在下次请求过来之后,就可以直接从缓存中获取。这里要注意一个点,如何判定一定不存在!!
2.3.2 布隆过滤
如图所示,在访问所有资源(cache, DB)之前,将存在的key用布隆过滤器提前保存起来,做第一层拦截。算法的简单图解如下
但是布隆过滤需要一开始就初始化好全量数据,在实际运用场景中,面对TB级的数据,预热阶段可能就需要耗费特别长时间。
2.4 缓存雪崩
前面讲过,雪崩是指大量请求透过缓存直接打到后端,对DB/RPC/HTTP后端服务造巨大压力,甚至瘫痪。
出现对情况多种多样,大量Key同时过期、Cache服务宕机或者不响应等等,都可能导致。这里就需要针对情况来做处理。
2.4.1 Cache服务可用性
Redis/Memcache都是支持集群部署的,并且通过一些容灾策略比如一致性hash、哨兵机制、数据备份、主从复制来保证某个cache节点不可用的情况下,可以快速切换到可用节点。
2.4.2 提前预防
为了避免对DB/RPC/HTTP后端服务造巨大压力,我们还要预防,一般通过限流策略,结合熔断机制,在超出系统负荷的时候,拒绝掉部分流量,保证系统的整体可用
2.4.3 Key过期时间优化
过期时间尽量设置的较为离散,比如对不同key设置不同长度的过期时间,某些key设置为1分钟,某些设置为10min
关于作者
某团基础架构部搬砖工,专注于高并发、高可靠系统研发。本公号主要素材来自于个人日常工作、思考,偶尔也有前沿新闻、国外译文。关注我就对了= =
往期文章:
相关推荐
- Java面试题合集200道!
-
1.Java中操作字符串都有哪些类?它们之间有什么区别?String、StringBuffer、StringBuilder.String和StringBufer、StringBuilder的区别...
- JAVA分布式锁的原理,及多种分布式实现优劣对比分析
-
引题比如在同一个节点上,两个线程并发的操作A的账户,都是取钱,如果不加锁,A的账户可能会出现负数,正确的方式是对账户acount进行加锁,即使用synchronized关键字,对其进行加锁后,当有线程...
- 百度Linux C++后台开发面试题(个人整理)
-
1、C/C++程序的内存分区其实C和C++的内存分区还是有一定区别的,但此处不作区分:1)、栈区(stack)—由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中...
- 什么是云计算?看这篇就够了(建议收藏)
-
一、什么是云?云,又称云端,指无数的大型机房或者大型数据中心。二、为什么需要云?1)从用户的角度来讲:传统应用的需求日益复杂,比如需要支持更多的用户,需要更强的计算能力等,为满足这些日益增长的需求,企...
- 写PHP框架需要具备那些知识?
-
如果没用过框架,讨论各个框架的内容都没有可讨论性,想自己写个框架涉及到的内容很多,个人觉得自己写一个框架对自己的逻辑思维,开发架构以及这门语言都有质的提升。可以参照其他框架的源代码,仅仅是看他们的思路...
- 不允许还有Java程序员不了解BlockingQueue阻塞队列的实现原理
-
我们平时开发中好像很少使用到BlockingQueue(阻塞队列),比如我们想要存储一组数据的时候会使用ArrayList,想要存储键值对数据会使用HashMap,在什么场景下需要用到Blocking...
- Java性能优化指南—缓存那些事
-
由于笔者自身水平有限,如果有不对或者任何建议欢迎批评和指正本文预计阅读时间10分钟,分为前言、填坑两部分,主要包含缓存的基本使用到高级应用场景的介绍一、前言在处理高并发请求时,缓存几乎是无往不利的利器...
- 卓象科技:Nosql的介绍以及和关系型数据库的区别
-
Nosql介绍NoSQL(NotOnlySQL),泛指非关系型数据库。Nosql的全称是NotOnlySql,这个概念很早就有人提出,在09年的时候比较火。Nosql指的是非关系型数...
- 腾讯一面凉经(一面竟然就问了2小时,什么情况?)
-
这次一面感觉是在打心理战,哥们自己的心里防线基本是被击溃,面到怀疑人生的程度,所以过程感觉不是太好,很多题哥们自己也感觉没答好,要么答得“缺胳膊少腿”,要么就是“画蛇添足”。先是聊项目,从项目的架构设...
- 我凭借这份pdf,最终拿到了阿里,腾讯,京东等八家大厂offer
-
怎样才能拿到大厂的offer,没有掌握绝对的技术,那么就要不断的学习我是如何笑对金九银十,拿到阿里,腾讯等八家大厂的offer的呢,今天分享我的秘密武器,美团大神整理的Java核心知识点,面试时面试官...
- 高并发 异步解耦利器:RocketMQ究竟强在哪里?
-
本文带大家从以下几个方面详细了解RocketMQ:RocketMQ如何保证消息存储的可靠性?RocketMQ如何保证消息队列服务的高可用?如何构建一个高可用的RocketMQ双主双从最小集群?Rock...
- 阿里最新Java架构师成长笔记开源
-
下面先给大家上一个总的目录大纲,基础的东西就不进行过多的赘述,我们将会从JVM说起,同时由于每篇的内容过多,我们也只说重点,太过基础的内容谁都会,我就不多敲字浪费大家的时间了!JVM多线程与高并发Sp...
- 程序员失业2个月找不到工作,狂刷了5遍这份pdf终获字节跳动offer
-
写在前面1月初失业,找了近2个多月的工作了,还没找到心仪的工作,感觉心好慌,不知道该怎么办了?找不到工作的时候压力很大,有人说自信会很受打击,还有人说会很绝望,是人生的低谷……尽管很多时候我们自己知道...
- Spring AI 模块架构与功能解析
-
SpringAI是Spring生态系统中的一个新兴模块,专注于简化人工智能和机器学习技术在Spring应用程序中的集成。本文将详细介绍SpringAI的核心组件、功能模块及其之间的关...
- Nginx从入门到精通,超详细整理,含项目实战案例|运维必学
-
Nginx是免费的、开源的、高性能的HTTP和反向代理服务器、邮件代理服务器、以及TCP/UDP代理服务器。因为它的稳定性、丰富的模块库、灵活的配置和低系统资源的消耗而闻名。Nginx可以做静态HT...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)