百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

面试官:说说如何解决Redis中的大热Key问题

mhr18 2024-12-06 16:16 28 浏览 0 评论

在技术面试中,Redis方向还是有挺多高频问题的,比如:击穿、穿透、雪崩、分布式锁、持久化方式、单线程改多线程等等。

除此之外,还有一个相对高频的面试题,那就是“Redis中如何解决大热Key问题”。而且,这也是一个比较务实的好问题。

毕竟相对而言,没有20年的脑残功力,谁也不会让Redis中的Key在同一时刻全部失效,引发缓存雪崩问题,也很少有人读取数据库后不将Key重新加载进Redis,任由它来个缓存击穿。

接下来言归正传,讲讲什么是Redis中的大热Key,以及会造成哪些影响。

Redis中的大热Key问题

先说说什么是大Key,这个不能顾名思义,其实是该Key所对应的value值比较大(如:大于1MB),存储它会占用比较大的内存空间,在进行读取的时候也会占用很大的网络带宽。

一般来讲,String类型的大Key相对少一些,集合类型(List、Set、ZSet、Hash)由于其包含的元素较多,则比较容易产生大Key。

其实大Key本身所带来的影响并不大,用户每秒钟请求它一两次的不会产生任何问题,最怕的就是大Key + 热Key双鬼拍门。

我们以常见的千兆网卡来计算,其最大传输速度为每秒钟128MB,那就意味着如果Redis的大Key为1MB、每秒钟有100多个请求打到该台服务器上,就能将这台Redis服务器的网卡打满,从而影响系统可用性。

如下图所示,一旦Redis Cluster中存储大热Key节点的网卡被打满,就会导致集群中的资源消耗倾斜,不仅大热Key的请求被影响,就连该节点下的其他请求也会被影响。

如何解决大热Key问题

嗯,既然问题出现了,我们还是希望通过有效的方式去解决它。下面就来盘点下几种常见的解决方案。

1、雨露均沾法

这种方案应该是代码改动量最小、见效最快的方式了,甚至都可以用来做Hotfix。如下图所示:

嗯,这样是不是就雨露均沾了?

有的同学可能会说,我的系统中只有一个大热Key,怎么才能让它均摊到各个服务器中呢?

其实很简单,我们想想海量数据下的分库分表是如何做的呢?举个例子,原本是一张order表,分库分表后变成了order00、order01、......、order99。

如下图所示:

Redis Cluster也是一样的,如果是三主三从的话,我们将其后缀取数范围设置为0 — 14,这样可以将它的存储和请求流量相对均匀地分散开,单服务器所承载的请求量降低为原来的1/3。

具体落地步骤如下:

(1)当该大热Key出现set、del操作时,需要将该大热key所对应的0 — 14后缀全部进行添加、更新和删除操作,以保证其数据的一致性。

(2)当该大热Key出现get操作时,需要将该大热key所对应的0 — 14后缀中随机挑选一个进行读取,以保证其热点分散化。

生成随机数的代码很简单,使用Java中的Random工具类即可。

import java.util.Random;
 
public class RandomNumberGenerator {
    public static void main(String[] args) {
        Random random = new Random();
 
        // 生成一个0到14之间的随机数
        int randomNumber = random.nextInt(15); 
        System.out.println(randomNumber);
    }
}


“雨露均沾法“适用于该大热Key的改动较少,且请求访问量级可控,不会让Redis Cluster网卡成为瓶颈的场景。

2、黄雀在后法

如果用了“雨露均沾”法仍然不能解决问题,此时我们可以考虑用该种方法。

因为绝大多数情况下,一个系统应用服务器的数量一定是多于Redis Cluster主节点的数量的,我们就可以通过Local Cache来在前面顶一波大热Key了,只有在Local Cache失效的情况下,才会访问Redis Cluster。

如下图所示:

在系统QPS比较高的情况下,哪怕给Local Cache设置为一秒钟过期,其命中率依然会很高,应该可以替Redis Cluster挡住99%+的请求。

至于在有了Local Cache的情况下,是否还需要使用Redis Cluster进行二次防护,这是个仁者见仁智者见智的问题。

不用的话,可以减少系统的复杂度和多存储下数据一致性的问题,而用的话,则可以保护数据库这个最为系统链路中最为稀缺的资源。

”黄雀在后法“适用于对该大热Key的改动较少,且对数据实时性要求不是很高的业务场景。

3、先行过滤法

实话实说,我认为99%的大热Key问题,都可以通过重新梳理业务逻辑的方式解决的。

其原因在于,无论是我们的PC端还是手机端,当前能给用户看到的屏幕内容是非常有限的,一定是对大热Key进行二次数据过滤后,才返回给客户端的。

如下图所示:

基于此种情况,我们可以将数据筛选过滤这个动作前置化,下沉到往Redis Cluster中生成数据的时候进行,或是从Redis Cluster中获取数据的时候进行,这样就不会再出现网卡被打满,从而影响系统可用性的情况。

举个例子,很多同学都喜欢通过Redis中的ZSet数据类型去构建排行榜,但在某些业务场景下排行榜中的元素会比较多,比如:电商平台上的热门商品排行榜。

此时,如果循规蹈矩、一个不落地把平台上的所有商品全部吃进ZSet中,那肯定妥妥的是一个大热Key。

但换个角度思考,该排行榜在服务器端一定会进行数据过滤的,最终展示给用户会一定是下图中的样子。

在此情况下,我们其实只用ZSet存储销量Top 10的热门商品信息即可,在榜单上的商品销量增加的时候,直接进行ZINCRBY操作添加对应分数。

但为了防止榜单排名发生变化,假设排在第11名的商品的销量超过排名第10的商品上榜,我们需要通过后台的定时任务来定期重构商品榜单。

这种方案就是先行过滤数据来减少网络资源消耗的方案,并在一定程度上牺牲了数据时延性。

”先行过滤法“可以从根本上解决大热Key的问题,但会改动到核心的代码逻辑,且需要case by case地进行问题分析,并不存在一个通用的解决方案。

结语

我想文章讲到这里,无论是应对面试官的刁难还是解决项目中的实际问题,都应该已经足够了。

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: