K8s 应用管理之道-有状态服务(k8s部署有状态应用)
mhr18 2024-10-12 04:48 39 浏览 0 评论
摘要: 用户通过 Deployment、ReplicationController 可以方便地在 kubernetes 中部署一套高可用、可扩展的分布式无状态服务。这类应用不在本地存储数据,通过简单的负载均衡策略可实现请求分发。
背景
用户通过 Deployment、ReplicationController 可以方便地在 kubernetes 中部署一套高可用、可扩展的分布式无状态服务。这类应用不在本地存储数据,通过简单的负载均衡策略可实现请求分发。随着 k8s 的普及和云原生架构的兴起,越来越多的人希望把数据库这类有状态服务也通过 k8s 进行编排。但因为有状态服务的复杂性,这一过程并不容易。本文将以最流行的开源数据库 MySQL 为例,介绍如何在 k8s 上部署运维有状态服务。本文所作的调研基于k8s 1.13。
使用 StatefulSet 部署 MySQL
本章将以 k8s 官方教程 Run a Replicated Stateful Application 中提供的样例为基础,介绍如何基于 StatefulSet 部署高可用 MySQL 服务。
StatefulSet 简介
Deployment、ReplicationController 是为无状态服务而设计的,它们中 pod 的名称、主机名、存储都是不稳定的,且 pod 的启动、销毁顺序随机,并不适合数据库这样的有状态应用。为此,k8s 推出了面向有状态服务的工作负载 StatefulSet。其管理的 pod 具有如下特点:
- 唯一性 - 对于包含 N 个副本的 StatefulSet,每个 pod 会被分配一个 [0,N)范围内的唯一序号。
- 顺序性 - StatefulSet 中 pod 的启动、更新、销毁默认都是按顺序进行的。
- 稳定的网络身份标识 - pod 的主机名、DNS 地址不会随着 pod 被重新调度而发生变化。
- 稳定的持久化存储 - 当 pod 被重新调度后,仍然能挂载原有的 PersistentVolume,保证了数据的完整性和一致性。
服务部署
这里介绍的高可用 MySQL 服务由一个 master 节点和多个从 master 上异步复制数据的 slave 节点组成,即一主多从复制模型。其中,master 节点可用来处理用户的读写请求,slave 节点只能用来处理用户的读请求。
为了部署这样的服务,除了 StatefulSet 之外,还需要使用许多其它类型的 k8s 资源对象,包括 ConfigMap、Headless Service、ClusterIP Service 等。正是它们间的相互配合,才能让 MySQL 这样的有状态服务有条件运行在 k8s 之上。
ConfigMap
为了便于维护应用配置,大型系统和分布式应用常常采用集中式的配置管理策略。在 k8s 环境下,用户可以通过 ConfigMap 将配置和 pod 分离,这有助于保持工作负载的可移植性,使其配置更易于更改和管理。
样例包含一个名为mysql的 ConfigMap,当 StatefulSet 中的 pod 启动时,会根据自己的角色从 ConfigMap 中读取合适的配置。
Headless Service
Headless Service 会为关联的每一个 pod 提供对应的 DNS 地址,格式为<pod-name>.<service-name>。这样,客户端就可以自由地选择想要访问的应用实例,同时也能够解决分布式环境下不同实例之间身份识别的问题。
样例包含一个名为mysql的 Headless Service,该 service 与 StatefulSet 中的 pod 相关联,这些 pod 将被分配如下 DNS 地址mysql-0.mysql、mysql-1.mysql、mysql-2.mysql。这样,客户端就可以通过mysql-0.mysql访问 master 节点,通过mysql-1.mysql或mysql-2.mysql访问 slave 节点。
ClusterIP Service
为了方便只读场景下的访问,样例提供了一个名为mysql-read的普通 service。该 service 拥有自己的 cluster IP,并会将请求分发至关联的 pod(包括 master 和 slave),为用户屏蔽 pod 的访问细节。
StatefulSet
StatefulSet 是服务部署的关键,它管理的每个 pod 会被分配一个唯一的名称,格式为<statefulset-name>-<ordinal-index>。样例中的 StatefulSet 名为mysql,因此这些 pod 分别被命名为mysql-0,mysql-1和mysql-2。默认情况下,它们会按顺序创建,并按逆序销毁。
如下图所示,一个 pod 包含 2 个 init container 和 2 个 app container,并且通过唯一的 PersistentVolumeClaim 和存储卷供应方提供的 PersistentVolume 绑定。
和 Pod 相关的各个组件的功能如下:
- 容器init-mysql的主要功能是生成配置文件。它会从 hostname 中提取 pod 序号,并将该序号存入文件/mnt/conf.d/server-id.cnf中。另外,它还会根据节点类型将 master.cnf 或 slave.cnf 从 ConfigMap 中拷贝到/mnt/conf目录下。
- 容器clone-mysql的主要功能是克隆数据。Pod 编号为N+1的clone-mysql会将数据从编号为N的 pod 中克隆至绑定的 PersistentVolume 里。
- Init container 运行完成后,app container 开始运行。容器mysql负责运行着真正的 mysqld 服务。
- 容器xtrabackup以 sidecar 模式运行。当它发现容器mysql中的 mysqld 就绪后,会通过命令START SLAVE启动 slave 节点的数据复制流程。另外,它还会监听来自其它 pod 的数据克隆请求。
- StatefulSet 通过 volumeClaimTemplates 为每一个 pod 关联了一个独有的 PVC,样例中编号为N的 pod 关联了名为data-mysql-N的 PVC,而这个 PVC 又会和存储系统提供的 PV 绑定。正是这种机制,保证了 pod 被重新调度后仍然能挂载原有的数据。
服务运维
为了保证服务性能、提升系统可靠性,部署工作完成后还需要相应的运维支撑。对于数据库服务,常见的运维工作包括服务故障恢复、服务扩容缩容、服务状态监控、数据备份恢复等。
服务故障恢复
服务在遇到故障时能否自愈,是判断一个系统自动化程度的关键指标。在当前架构下,MySQL 服务在遇到宿主机宕机,master 或 slave 节点崩溃等问题时能自动恢复。在上述问题发生后,k8s 会重新调度遇到问题的 pod,让其重新运行。由于使用了 StatefulSet,这些 pod 的名称、主机名和存储会与原来保持一致。
服务扩容缩容
在 MySQL 一主多从复制模型下,扩容缩容意味着调整 slave 节点个数。得益于 StatefulSet 对 pod 启动、销毁顺序的保证,通过如下命令就可以轻松实现服务的扩容缩容。
kubectl scale statefulset mysql --replicas=<NumOfReplicas>
服务状态监控
要保证服务的稳定性离不开对服务运行状态的监控。除了通过就绪探针和活性探针检测服务是否正常外,往往还需要更细粒度的监控指标。用户可以借助 mysqld-exporter 将 MySQL 的核心指标暴露给 prometheus,然后基于 prometheus 做监控告警。对于 mysqld-exporter,推荐以 sidecar 模式和 mysqld 容器部署在同一个 pod 中。
数据备份恢复
数据的备份和恢复是保障数据安全的有效手段。这里,用户可以直接使用存储卷暴露的接口或者利用 VolumeSnapshot 功能完成数据的备份恢复工作,下面分别进行介绍。
使用存储卷接口
许多存储卷供应方都提供了保存数据快照和基于快照恢复数据的功能,这些功能通常以接口的形式暴露给用户。采样这种方式要求用户熟悉对应存储卷供应方提供的操作接口。例如服务选用了阿里云云盘作为外部存储卷,需要用户了解云盘提供的快照接口。
使用 VolumeSnapshot
K8s v1.12 引入了 3 个快照相关的资源对象VolumeSnapshot、VolumeSnapshotContent、VolumeSnapshotClass,通过它们提供了快照操作的标准方法。这样,用户可以在不感知外部存储卷的情况下,为存放 MySQL 数据的存储卷创建快照,或者基于快照恢复数据。
相比直接使用底层存储卷接口,使用 VolumeSnapshot 显然是更为理想的方法。但目前 VolumeSnapshot 还处在 Alpha 阶段,支持标准快照操作的外部存储卷也有限,这些都限制了当下 VolumeSnapshot 的应用场景。想进一步了解 VolumeSnapshot 可参考文档 Volume Snapshots。
使用 Operator 部署 MySQL
虽然用户可以基于 StatefulSet 在 k8s 中部署运维一套高可用 MySQL 服务,但过程相对复杂。用户既要熟悉各种 k8s 资源对象,又要学习很多 MySQL 的操作细节,同时还需维护一套复杂的管理脚本。为了降低在 k8s 中部署复杂应用的门槛,诞生了 Kubernetes Operator。
Operator 简介
Operator 是由 CoreOS 公司推出的,用来打包、部署和管理需要运行在 k8s 之上的复杂应用的一种方法。Operator 将运维人员对软件操作的知识代码化,同时综合运用 k8s 各种资源对象来实现复杂应用的部署和运维。
Operator 通过 CustomResourceDefinition 为服务定义了新的资源对象,同时通过自定义控制器来保证应用处于预期状态。
Operator 的工作流程可抽象成以下三个步骤:
- Observe - 通过 k8s API 观察目标对象的状态。
- Analyze - 分析当前状态与期望状态的差别。
- Act - 执行编排操作,将当前状态调整为期望状态。
Oracle MySQL Operator
对于 MySQL 服务,已经有很多优秀的开源 Operator 解决方案,包括 grtl/mysql-operator、oracle/mysql-operator、presslabs/mysql-operator、kubedb/mysql 等。本节将要介绍的 Oracle MySQL Operator 便是这些开源解决方案的典型代表。
Oracle MySQL Operator 工作原理
Oracle MySQL Operator 支持以下 2 种 MySQL 部署模式。
- Primary - 服务由一个可读写的主节点和多个只读的从节点组成。
- Multi-Primary - 集群中各节点角色相同,没有主从的概念,每个节点都可以处理用户的读写请求。
下图展示了 Multi-Primary 模式下 Operator 的工作原理。
下列流程是理解 Operator 工作原理的关键:
- 使用 k8s 的 CustomResourceDefinition(CRD) 定义若干和 MySQL 部署运维相关的资源对象。
- mysqlclusters - 用于描述集群的期望状态,包括部署模式、节点个数等。
- mysqlbackups - 用于描述按需备份策略,可以配置备份数据的存放地点,如 AWS S3。
- mysqlrestores - 用于描述数据恢复策略,需要配置备份数据和目标集群。
- mysqlbackupschedules - 用于描述定期备份策略,可以配置备份的时间间隔。
- 在 k8s 中部署一个 Operator 实例,该 Operator 会持续监听针对这些资源对象的 CRUD 操作,并观察对象状态。
- 当用户执行了某项操作,例如创建一个 MySQL 集群时,一个新的 MySQLCluster 资源对象会被创建。当 operator 监听到了 MySQLCluster 的创建事件后,会根据用户配置创建符合需求的集群。这里创建了一个基于 Group Replication 的高可用 MySQL 集群,使用了 StatefulSet、Headless service 等原生 k8s 资源对象。
- 当 Operator 观察到 MySQLCluster 的当前状态与期望状态存在差别时,会执行相应的编排操作,保证状态的一致性。
服务部署
得益于 Operator 对复杂部署细节的封装,现在创建一个集群变得非常简单。例如,通过如下配置就可以部署一个包含 3 个节点的 MySQL Multi-Primary 集群。
apiVersion: mysql.oracle.com/v1alpha1 kind: Cluster metadata: name: mysql-multimaster-cluster spec: multiMaster: true members: 3
服务运维
在 Operator 模式下,同样会涉及服务故障恢复、服务扩容缩容、服务状态监控、数据备份恢复等运维工作。
服务故障恢复
由于 StatefulSet 的存在,当某个 MySQL 服务实例崩溃时,k8s 会对其重新调度。另外,如果 StatefulSet 被误删,Operator 也会对其进行重建。
服务扩容缩容
通过更改资源对象 MySQLCluster 的字段spec.members可以轻松实现服务扩容缩容。这里只对用户暴露了 MySQLCluster,屏蔽了底层 k8s 资源对象。
服务状态监控
可以在 k8s 中部署 Prometheus 监控 Operator 和各个 MySQL 集群的状态。具体步骤可参考文档 Monitoring。
数据备份恢复
可以通过资源对象 MySQLBackup、MySQLRestore 对数据进行备份和恢复,为用户屏蔽了不同存储卷操作上的差别。另外,还可以通过 MySQLBackupSchedule 创建定时备份任务。
例如,以下配置可以每隔 30 分钟对 MySQL 集群mysql-cluster的数据库test进行备份。
[...] kind: BackupSchedule spec: schedule: '*/30 * * * *' backupTemplate: cluster: name: mysql-cluster executor: provider: mysqldump databases: - test [...]
总结
本文分别介绍了通过原生 k8s 资源对象 StatefulSet 以及通过 MySQL Operator 部署运维一套高可用 MySQL 服务的方法和原理。可以看到 Operator 屏蔽了复杂应用的编排细节,大大降低了它们在 k8s 中的使用门槛。如果您有其它复杂应用需要部署,建议采用 Operator 方式。
参考资料
- 亲历者说:Kubernetes API 与 Operator,不为人知的开发者战争
https://yq.aliyun.com/articles/685522
- Running MySQL on Kubernetes using an operator
https://banzaicloud.com/blog/mysql-on-kubernetes/
扩展阅读
- K8s 应用管理之道 - 升级篇(一)
https://yq.aliyun.com/articles/688626
- K8s 应用管理之道 - 升级篇(二)
https://yq.aliyun.com/articles/688627
作者:吴波bruce_wu
相关推荐
- IM群聊消息如此复杂,如何保证不丢不重?
-
群聊是多人社交的基本诉求,不管是QQ群,还是微信群,一个群友在群内发了一条消息:(1)在线的群友能第一时间收到消息(2)离线的群友能在登陆后收到消息群消息的复杂度要远高于单对单消息。群消息的实时性,可...
- Python 网络爬虫实战:从零到部署的完整流程
-
适用人群:初-中级Python开发者、数据分析师、运维/测试自动化工程师工具栈:Python3.11+requests+BeautifulSoup/lxml+pandas+(...
- 用上Kiro之后,完全没理由为Cursor续费了
-
替Cursor续费前最后一秒,免费IDEKiro把钱包按死在屏幕前五位数年费的AI编程助手,被一匹黑马零元秒杀。用过Kiro的人,开note第一件事就是删掉Cursor的自动续费,动作快到连...
- 分布式微服务中的搜索引擎:架构与实战盘点
-
01、为什么微服务需要分布式搜索?在单体应用时代,我们通常使用单一数据库的全文检索功能(如MySQL的LIKE语句)或简单的搜索引擎(如早期的Lucene)。但随着业务规模扩大,这种架构暴露出诸多问题...
- 产品列表获取API接口详解
-
在现代软件开发中,API(应用程序编程接口)是获取产品列表的核心工具,它允许开发者从远程服务器高效地检索数据。本文将逐步介绍如何设计和使用产品列表获取API接口,包括核心概念、实现步骤、代码示例以及最...
- 企业和个人基于业务知识和代码库增强的大模型生成代码实践
-
作者:京东零售杨亚龙1.源起李明是今年刚加入某互联网公司的研发新人,满怀期待地开始了他的职业生涯。然而,短短两周后,他的热情就被现实浇了一盆冷水。第一周:当他第一次接手需求时,mentor只是简单...
- 从零到一:独立运行若依框架系统并进行本地二次开发
-
####一、环境准备1.**基础环境**:-JDK1.8+(推荐JDK17)-Maven3.6+-MySQL5.7+(推荐8.0)-Redis5.0+-Node.js16...
- 一文教你高效优化在Spring Boot3中遇到深度分页查询性能难题?
-
你有没有这样的经历?在使用SpringBoot3开发项目时,深度分页查询操作让程序运行得越来越慢,页面加载时间变得难以忍受,不仅影响用户体验,还可能导致项目进度受阻。明明代码逻辑看起来没问题,可...
- JAVA面试|如何优化limit分页
-
我们来详细通俗地聊聊如何优化LIMIToffset,size分页。核心问题在于OFFSET的值很大时,性能会急剧下降。想象一下数据库的工作方式,你就明白为什么了。一、为什么OFFSET大时慢?假...
- MySQL(143)如何优化分页查询?
-
优化分页查询是提升数据库性能和用户体验的重要手段。特别是在处理大数据集时,分页查询的效率对系统性能有显著影响。以下是优化分页查询的详细步骤和代码示例。一、传统分页查询传统的分页查询使用OFFSET...
- Seata概述
-
什么是SeataSeata是一款开源的分布式事务解决方案,致力于在微服务架构下提供高性能和简单易用的分布式事务服务也是SpringCloudAlibaba提供的组件Seata官方文档https...
- Docmost:一款开源的Wiki和文档协作软件
-
是一款开源的团队协作Wiki与文档管理工具,定位为Confluence和Notion的开源替代品,专注于提供高效、安全且可定制的知识库解决方案。Docmost的核心优势在于开源免...
- B端系统管理「字典管理」模块实战指南
-
字典管理听起来像“后端杂务”,其实是B端系统配置能力的关键支点。本指南将从真实业务场景出发,系统拆解该模块的设计逻辑、关键字段与典型坑位,让你一文读懂如何搭建一个能跑得久、配得稳的字典模块。一、字典管...
- Spring Boot 整合 Redis BitMap 实现 签到与统计
-
要在SpringBoot中实现RedisBitMap来进行签到和统计,您需要按照以下步骤进行操作:添加Redis依赖:在pom.xml文件中添加Redis依赖:<dependen...
- 周期性清除Spark Streaming流状态的方法
-
在SparkStreaming程序中,我们经常需要使用有状态的流来统计一些累积性的指标,比如各个商品的PV。简单的代码描述如下,使用mapWithState()算子:valproductPvSt...
你 发表评论:
欢迎- 一周热门
-
-
Redis客户端 Jedis 与 Lettuce
-
高并发架构系列:Redis并发竞争key的解决方案详解
-
redis如何防止并发(redis如何防止高并发)
-
Java SE Development Kit 8u441下载地址【windows版本】
-
开源推荐:如何实现的一个高性能 Redis 服务器
-
redis安装与调优部署文档(WinServer)
-
Redis 入门 - 安装最全讲解(Windows、Linux、Docker)
-
一文带你了解 Redis 的发布与订阅的底层原理
-
Redis如何应对并发访问(redis控制并发量)
-
Oracle如何创建用户,表空间(oracle19c创建表空间用户)
-
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle主从同步 (56)
- oracle 乐观锁 (53)
- redis 命令 (83)
- php redis (97)
- redis 存储 (67)
- redis 锁 (74)
- 启动 redis (73)
- redis 时间 (60)
- redis 删除 (69)
- redis内存 (64)
- redis并发 (53)
- redis 主从 (71)
- redis同步 (53)
- redis结构 (53)
- redis 订阅 (54)
- redis 登录 (62)
- redis 面试 (58)
- redis问题 (54)
- 阿里 redis (67)
- redis的缓存 (57)
- lua redis (59)
- redis 连接池 (64)