百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

由Redis Cluster集群引发的对几种算法的思考

mhr18 2024-11-18 14:29 29 浏览 0 评论

对比几个相似算法,理解Redis Cluster集群所使用算法的原因。首先介绍一下单调性:

单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中,又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到新的缓冲中去,而不会被映射到旧的缓冲集合中的其他缓冲区。

一、HASH取余算法

简单公式:

hash(object)%N

应用场景:

比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N 个 cache 上呢,你很可能会采用类似下面的通用方法计算 object 的 hash 值,然后均匀的映射到到 N 个 cache ;

一切都运行正常,再考虑如下的两种情况;

1 一个 cache 服务器 m down 掉了(在实际应用中必须要考虑这种情况),这样所有映射到 cache m 的对象都会失效,怎么办,需要把 cache m 从 cache 中移除,这时候 cache 是 N-1 台,映射公式变成了 hash(object)%(N-1) ;

2 由于访问加重,需要添加 cache ,这时候 cache 是 N+1 台,映射公式变成了 hash(object)%(N+1) ;

1 和 2 意味着什么?这意味着突然之间几乎所有的 cache 都失效了。对于服务器而言,这是一场灾难,洪水般的访问都会直接冲向后台服务器;

再来考虑第三个问题,由于硬件能力越来越强,你可能想让后面添加的节点多做点活,显然上面的 hash 算法也做不到。

hash取余不满足单调性原则。

有什么方法可以改变这个状况呢,这就是 一致性hash。

二、一致性hash算法

consistent hashing 是一种 hash 算法,简单的说,在移除 / 添加一个 cache 时,它能够尽可能小的改变已存在key 映射关系,尽可能的满足单调性的要求。

在一致性hash算法中,将0到2^32-1区间的数字按顺时针形成一个圆环,如下图所示(图没有截全,请自行脑补):

在redis集群中,将集群服务器的ip或者服务器名称进行hash函数,然后对2^32取模,得到的数字在上述圆环中定位,得到服务器在圆环中的位置。

当在redis集群中存入key时,对key进行hash函数,然后进行2^32取模,得到的数值就是该key在hash环上的位置。然后从该位置起,顺时针沿着圆环走,走到第一个服务器的位置,就是该key存放的位置。如下图所示:

ObjectA通过hash()函数计算并进行2^32取模后,得到在hash环上的位置,然后顺时针找到第一个服务器位置,就是ObjectA存放的位置。ObjectB也是同样的道理。

这么设计有何好处呢?我们看下图:

在上图中,假设C服务器宕机了,那么此时,C服务器中存放的key,会瞬移到D服务器中。同时,新加入的数据,通过计算得到在hash环上的位置后,顺时针查找服务器也会直接跳过C,存放到D中。如此一来,服务器宕机不会影响到全部服务器中数据存放。而是只影响了D服务器中数据的存放内容。这就避免了在hash取余中宕机一台服务器,分母就会变化而导致所有服务器中数据都要变化的情况出现。

同样的,当加入一台服务器时,也是在hash环中查找加入的位置,新的数据顺时针找到新加服务器后,会存入新加的服务器上,而不影响其他服务器的数据。可见,hash一致性算法满足了单调性原则。

那么hash一致性算法有何缺点呢?

假如现在有三台服务器A、B和C,通过计算,A和B在hash环上位置比较近,B和C,C和A距离比较远。那么此时,顺时针落在C服务器和A服务器的数据概率就会变大。落在B服务器上的概率就小。这就出现了 数据倾斜 的问题。不能均匀分配数据。下图也是数据倾斜问题的一个体现:

三、hash槽位算法

针对一致性hash算法数据倾斜的问题,Reids Cluster进行了优化,衍生出了hash槽位算法。下面看是如何实现的。

redis集群中,有固定的槽位数:16384。redis会根据集群master数量,平均分配给每个master节点一定数量的槽位。redis会根据key进行hash计算,并对16384进行取模,得到的结果就是槽位数。这个槽位分配给了哪个服务器,那么这条数据就存放到哪个服务器上。

当发生redis集群扩容时,集群加入新节点后,需要执行reshard命令,进行重新hash分配。此时,redis会让用户输入分配新节点个数。一般就是16384个槽位/主节点数得到的值,对数据进行平分。选择平分后,是之前的节点的每个节点,分一些key出来,给到新节点,来凑够新节点的个数。因为redis的槽位总数是固定16384个,新加一个节点,rehash一次后,槽位数和节点的对应关系肯定会发生变化。就是原有节点拿出一部分槽位来,分给新加入节点。

因为新加入节点槽位是其他节点匀过来的,所以,其槽位数不是连续的,而是一段一段的。为何是其他节点匀过来,而不是全部重新分配一遍槽位呢,因为之前的节点已经存入数据了,如果全部重新分配,那么已经存入的key还需要重新整理,所以优先分配没有存入key值的槽位到新节点。

redis集群缩容就是将删除的槽位,平均分配给其他master节点来接收数据。

在redis cluster集群中,相当于是节点上放的是槽位,槽位里放的是数据。通过平均分配节点上的槽位,来避免一致性hash中数据倾斜的问题

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: