百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

redis主从高可用方案

mhr18 2024-11-22 17:41 31 浏览 0 评论

1. 需求描述

redis 主从模式下,当 master 服务意外停掉或该服务所在的主机发生宕机故障或网络故障时,另一台 redis 服务会由 slave 自动成为 master,提供读写服务。

2. 需求分析

刚开始主从模式如下:

当redis master挂掉后,原来的redis slave被提升为主,客户端自动将请求切换到新的master,如下图:

原来的master恢复后,手动添加节点,并以slave的角色加入到原来的主从模式中,如下图:


根据上述故障恢复流程,可以抽象出以下几个关键技术点:

  1. 当 master 挂掉后,如何将 slave 提升为新的 master ?
  2. 如何通知 client 将请求打到新的 master ?

3. 方案调研

3.1 如何将 slave 提升为新的 master

使用 redis 官方的 sentinel 组件。如下图:

使用一组 sentinel 节点对 redis 主从节点做监控。当 master 节点故障后,sentinel 会从 slave 节点中选出一个做为 master,并通知其它的 slave 和新的 master 做数据同步,如下图:


问题点:

  1. 使用一组 sentinel 集群监控所有的 reids 主从节点。当监控的主从节点较多时,sentinel 是否会有性能瓶颈?
  2. sentinel 不支持跨机房部署,备机房是否需要做 sentinel 监控?

3.2 如何通知 client 将请求打到新的 master

3.2.1 方案一

客户端每次请求时,先从 sentinel 中获取 master 地址,再访问 master 节点。

  1. 客户端先连接 sentinel 节点,执行 SENTINEL get-master-addr-by-name <master name>命令,返回给定名字的 master 的 IP 地址和端口号。 如果这个 master 正在执行故障转移操作, 或者针对这个 master 的故障转移操作已经完成, 那么这个命令返回新的 master 的 IP 地址和端口号。
  2. 通过获取到的 master 地址和端口号,再访问 master 节点。

优点:

  1. 方案简单,不需要依赖其它组件或配置。

缺点:

  1. 业务端需要做修改,每次访问 master 节点前,先要查询 sentinel,多一次网络传输。

3.2.2 方案二

VIP 漂移,master 节点所在机器配置 VIP (虚拟ip地址),当发生主从切换后,将 VIP 绑定到新的 master 节点所在的机器上。

触发 VIP 漂移有两种方式:

1.sentinel 主动触发


故障发生后,sentinel 触发 VIP 漂移,将 VIP 绑定到新的 master 上


sentinel 如何触发 VIP 漂移?

这里可以使用 redis sentinel 的一个参数 client-reconfig-script

sentinel client-reconfig-script <master-name> <script-path>
当一个master由于failover而发生改变时,这个脚本将会被调用并且传递6个参数
<master-name>、 <role>、 <state>、 <from-ip>、 <from-port>、 <to-ip> 、<to-port>,
其中<to-ip>是新主redis的IP地址,可以在这个脚本里做VIP漂移操作。

举例:

sentinel client-reconfig-script master8000   /opt/notify_master6800.sh

修改三个服务器的redis-sentinel配置文件/etc/sentinel.conf,增加上面一行。然后在/opt/目录下创建notify_master6800.sh脚本文件,这个脚本做VIP漂移操作,内容如下:

#notify_master6800.sh脚本内容
#!/bin/bash
MASTER_IP=$6  #第六个参数是新主redis的ip地址
LOCAL_IP='192.168.56.101'  #其他两个服务器上为192.168.56.102,192.168.56.103
VIP='192.168.56.250'
NETMASK='24'
INTERFACE='eth1'
if [ ${MASTER_IP} = ${LOCAL_IP} ];then   
    /sbin/ip  addr  add ${VIP}/${NETMASK}  dev ${INTERFACE}  #将VIP绑定到该服务器上
    /sbin/arping -q -c 3 -A ${VIP} -I ${INTERFACE}
    exit 0
else 
   /sbin/ip  addr del  ${VIP}/${NETMASK}  dev ${INTERFACE}   #将VIP从该服务器上删除
   exit 0
fi
exit 1  #如果返回1,sentinel会一直执行这个脚本

优点:

  1. 对客户端透明,客户端无需改动。
  2. 故障切换响应快,sentinel 做完主从切换后,可以主动触发 VIP 漂移。

缺点:

  1. 只适合单个 redis 的高可用。如果机器上部署了多个redis master,只有一个 redis master 故障,就会导致 VIP 漂移,那么机器上其它 master 实例就无法访问(因为其它 master 还在原来的机器上,但请求已经打到 VIP 所在的机器上)。
  2. 需要有 ssh 权限,执行 VIP 漂移相关命令。

2.通过 keepalived 触发

在每台 redis 实例上的机器上起一个 keepalived 服务,在多个 keepalived 组里面有一个 keealived master 和多个 backup,master 上面有一个对外提供服务的 VIP。

keepalived master 会发组播到 backup,故障发生时,keepalived 检测到 redis master 不可用,调用自定的 stop 脚本,将本机器的 keepalived 进程杀死。keepalived backup 收不到 keepalived master 的 vrrp 包时,认为 keepalived master 挂掉了,这时就需要根据 vrrp 的优先级来选举一个 backup 当 master,这样的话就可以保证路由器的高可用了。


优点:

  1. 对客户端透明,客户端无需改动。
  2. 不需要通过脚本修改 VIP,keepalived 会自动设置。

缺点:

  1. 每个 redis 所在机器都要部署 keepalived 服务。
  2. VIP 漂移有一定的延时,依赖 keepalived 健康检测周期。
  3. 不适合单机器上部署多个 redis 实例。

VIP 漂移方案总结:

只适合单个 redis 高可用,不适合但机器上多个 redis 实例的部署。

3.2.3 方案三

使用 consul 服务发现组件,架构图如下:

  1. redis 节点所在的机器都部署一个 consul client,主要负责和 consul server 通信。
  2. redis 节点通过 consul client 将自己以服务的方式注册到 consul server。同一组主从节点注册的服务名相同。查询 consul server 时,相同服务名会返回该名称下所有可用的服务IP地址和端口。
  3. redis 节点注册服务时会提供一个自定义的健康检测脚本,consul client 定期执行健康检测脚本。脚本返回0表示服务可用,返回2表示服务不可用。
  4. 健康检测脚本主要判断该节点的 role 是否是 master,如果是 master,则返回0,表示服务可用;如果返回2,表示服务不可用。
  5. 向 consul 集群查询 test_redis 服务时,由于 slave 健康检测都不可用,所以只会返回 master 的地址。

发生故障转移时:

  1. sentinel 将 slave 1提升为 master 后,该节点的健康检测脚本发现服务的 role 变为 master,所以健康检测通过,服务可用。
  2. 向 consul 集群查询 test_redis 服务,返回新的 master 的 IP 地址和端口号。

上述故障转移流程,客户端都是先查询 consul server 获取可用的 master 地址,然后再通过 master 地址访问 redis 服务,类似于方案一中的先查 sentinel,再连接 master。如果是使用这种方案,引入 consul 组件显得多此一举,还不如方案一简单。那么通过 consul,有没有更优雅的方式来获取到 master 地址呢?—— consul DNS 接口。

通过 consul DNS 接口,做服务自动发现:

  1. 服务注册到 consul 后,consul 都会为服务生成一个域名,如test_redis.service.consul,后缀为service.consul
  2. 客户端通过域名访问服务,配置局域网内的 DNS 服务器,将后缀为 consul 的域名都转发到 conusl server 机器上。
  3. consul server 的 DNS 端口为8600,而默认的 DNS 端口为53,可以通过 dnsmasq 服务。在 consul server 机器上,启动 dnsmasq 服务,将 consul 域名转发到8600端口,这样就可以通过 consul server,返回域名对应的服务地址。

优点:

  1. 客户端通过域名访问服务,不需要做其它调整,后端切换 master 地址对客户端透明。
  2. 相比 VIP 漂移,更加灵活,支持对一台机器上的多个 redis 主从实例做高可用。

缺点:

  1. 引入了新的 consul 和 dnsmasq 组件,所有的 redis 机器几点都需要安装 consul client服务。

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: