Redis 集群手动故障切换
mhr18 2024-11-28 08:32 12 浏览 0 评论
总结写在前面:
- 使用cluster failover命令进行手动主从切换
- cluster failover命令的参数
- redis集群的切换步骤(理论)
redis集群的故障切换可以分成自动和手动两种。例如部署的3主3从的集群,如果一台master节点宕机,redis集群有能力自动选举新的主节点,完成故障迁移,保障系统的高可用性。
本文记录的故障切换是手动的操作,意义在于
- 当集群完全正常时,因为某些原因需要主从进行切换。例如我们需要下线某台服务器进行服务器升级。
- 当集群中多数master节点宕机,集群已不可用时的快速恢复。
操作
命令部分很简单,要注意的是这个命令必须在备节点上执行
cluster failover
或者
cluster failover force
或者
cluster failover takeover
第一种情况,集群正常时
这种情况是我们按计划进行服务器升级时,经常遇到的情况。
要升级的服务器上可能跑着很多个master节点,我们应该在变更前将该服务器上的master节点进行主备切换,这样下线服务器时可以做到业务应用无感知。
操作很简单,这种情况下只要在备节点上执行
cluster failover
具体redis做的切换步骤
- slave节点告知其master节点停止处理来自业务的请求
- master 节点将当前replication offset 回复给该slave节点
- salve节点在master节点的变更没有全部同步到自己时(追上replication offset),不会进行主备切换动作。
- salve节点追上replication offset,开始进行主备切换的工作:从集群中其他master处获取最新的epoch,然后广播自己的配置
- 原master节点收到配置更新:解除客户端的访问阻塞,回复重定向信息,以便客户端可以和新master通信。
第二种情况,集群已宕机
第二种情况就比较紧急了,可能遇到了意外情况导致多台或者全部master宕机,或者遇到网络分区隔离。测试redis集群已经是不可用状态。如果备节点都在,我们可以使用failover快速恢复redis集群服务。
此时在备节点上执行
cluster failover takeover
在上面第一种情况时,主备切换的第四步中需要从集群中其他master处获取最新的epoch。所以如果多数master已经宕机的情况下,是会获取失败的。
加上参数takeover,备节点会自己生成epoch。如果epoch不是最大的,则取当前有效epoch值中的最大值并自增作为新的配置epoch。
然后将原master节点管理的所有哈希槽分配给自己,接着就广播配置。
如此可以快速恢复集群能力。
有得必有失
TAKEOVER 违反Redis群集的last-failover-wins 原则,因为这种情况下epoch是备节点自己产生的,并没有同集群进行协商,所以可能存在冲突。
所以非紧急情况下不要使用takeover参数
没有用到的force
failover还有一个参数是force。
加上force的切换步骤是,不可master节点进行协商,直接开启第四步从集群中其他master处获取最新的epoch,然后广播自己的配置
所以,使用force的前提是多数master依然活着。
那么,这种情况下,如果master节点宕机,redis集群可以自动选出主节点切换。也不需要使用failover手动切换
所以,我没用过这个参数,没有什么场景适合使用。
- 上一篇:学习笔记:深入浅出redis
- 下一篇:2023年再不会Redis,就要被淘汰了
相关推荐
- B站收藏视频失效?mybili 收藏夹备份神器完整部署指南
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙很多B站用户都有过类似经历:自己精心收藏的视频突然“消失”,点开一看不是“已被删除”,就是“因UP主设置不可见”。而B站并不会主动通知...
- 中间件推荐初始化配置
-
Redis推荐初始化配置bind0.0.0.0protected-modeyesport6379tcp-backlog511timeout300tcp-keepalive300...
- Redis中缓存穿透问题与解决方法
-
缓存穿透问题概述在Redis作为缓存使用时,缓存穿透是常见问题。正常查询流程是先从Redis缓存获取数据,若有则直接使用;若没有则去数据库查询,查到后存入缓存。但当请求的数据在缓存和数据库中都...
- 后端开发必看!Redis 哨兵机制如何保障系统高可用?
-
你是否曾在项目中遇到过Redis主服务器突然宕机,导致整个业务系统出现数据读取异常、响应延迟甚至服务中断的情况?面对这样的突发状况,作为互联网大厂的后端开发人员,如何快速恢复服务、保障系统的高可用...
- Redis合集-大Key处理建议
-
以下是Redis大Key问题的全流程解决方案,涵盖检测、处理、优化及预防策略,结合代码示例和最佳实践:一、大Key的定义与风险1.大Key判定标准数据类型大Key阈值风险场景S...
- 深入解析跳跃表:Redis里的"老六"数据结构,专治各种不服
-
大家好,我是你们的码农段子手,今天要给大家讲一个Redis世界里最会"跳科目三"的数据结构——跳跃表(SkipList)。这货表面上是个青铜,实际上是个王者,连红黑树见了都要喊声大哥。...
- Redis 中 AOF 持久化技术原理全解析,看完你就懂了!
-
你在使用Redis的过程中,有没有担心过数据丢失的问题?尤其是在服务器突然宕机、意外断电等情况发生时,那些还没来得及持久化的数据,是不是让你夜不能寐?别担心,Redis的AOF持久化技术就是...
- Redis合集-必备的几款运维工具
-
Redis在应用Redis时,经常会面临的运维工作,包括Redis的运行状态监控,数据迁移,主从集群、切片集群的部署和运维。接下来,从这三个方面,介绍一些工具。先来学习下监控Redis实时...
- 别再纠结线程池大小 + 线程数量了,没有固定公式的!
-
我们在百度上能很轻易地搜索到以下线程池设置大小的理论:在一台服务器上我们按照以下设置CPU密集型的程序-核心数+1I/O密集型的程序-核心数*2你不会真的按照这个理论来设置线程池的...
- 网络编程—IO多路复用详解
-
假如你想了解IO多路复用,那本文或许可以帮助你本文的最大目的就是想要把select、epoll在执行过程中干了什么叙述出来,所以具体的代码不会涉及,毕竟不同语言的接口有所区别。基础知识IO多路复用涉及...
- 5分钟学会C/C++多线程编程进程和线程
-
前言对线程有基本的理解简单的C++面向过程编程能力创造单个简单的线程。创造单个带参数的线程。如何等待线程结束。创造多个线程,并使用互斥量来防止资源抢占。会使用之后,直接跳到“汇总”,复制模板来用就行...
- 尽情阅读,技术进阶,详解mmap的原理
-
1.一句话概括mmapmmap的作用,在应用这一层,是让你把文件的某一段,当作内存一样来访问。将文件映射到物理内存,将进程虚拟空间映射到那块内存。这样,进程不仅能像访问内存一样读写文件,多个进程...
- C++11多线程知识点总结
-
一、多线程的基本概念1、进程与线程的区别和联系进程:进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程;线程:是运行中的实际的任务执行者。可以说,进程中包含了多...
- 微服务高可用的2个关键技巧,你一定用得上
-
概述上一篇文章讲了一个朋友公司使用SpringCloud架构遇到问题的一个真实案例,虽然不是什么大的技术问题,但如果对一些东西理解的不深刻,还真会犯一些错误。这篇文章我们来聊聊在微服务架构中,到底如...
- Java线程间如何共享与传递数据
-
1、背景在日常SpringBoot应用或者Java应用开发中,使用多线程编程有很多好处,比如可以同时处理多个任务,提高程序的并发性;可以充分利用计算机的多核处理器,使得程序能够更好地利用计算机的资源,...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)