Kubernetes 动态扩容黑科技
mhr18 2025-05-23 18:33 3 浏览 0 评论
一、创新看点
传统 HPA | KEDA (Kubernetes Event-Driven Autoscaler) |
仅基于 CPU / 内存指标触发 | 支持 50+ 事件源:Kafka、Prometheus、Redis、HTTP QPS… |
采样周期 ≥15s,响应慢 | 秒级拉起新 Pod,平峰可自动归零 |
每个资源写一份 HPA YAML | 单一 ScaledObject 即可完成尺度策略 |
无法对非 Deployment 资源 | 支持 Job / StatefulSet / Cron |
二、整体架构
┌───────────────┐ metrics ┌─────────────┐
│ Event Source │────────────│ KEDA Scaler │
│ (Kafka / SQS) │ └──────┬──────┘
└───────────────┘ │
Creates HPA │
▼
┌──────────────┐
│ Workload │
│(Deployment) │
└──────────────┘
三、环境要求
- Kubernetes 1.26+
- Helm 3.10+
- 示例事件源:Redis5、Prometheus2.46
- 4C8G以上测试节点
四、实战落地 7步
步骤1:安装 KEDA Operator
helm repo add kedacore https://kedacore.github.io/charts
helm repo update
helm install keda kedacore/keda --namespace keda --create-namespace
步骤2:部署示例应用
kubectl create ns demo
kubectl apply -n demo -f https://raw.githubusercontent.com/kedacore/keda/main/examples/redis/redis-deploy.yaml
kubectl apply -n demo -f https://raw.githubusercontent.com/kedacore/keda/main/examples/redis/consumer-deploy.yaml
- redis:事件源
- consumer:耗时 100ms 模拟业务处理
步骤3:创建 ScaledObject(Redis 队列长度)
scaledobject.yaml
apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
name: redis-scaler
namespace: demo
spec:
scaleTargetRef:
name: consumer
minReplicaCount: 0
maxReplicaCount: 30
triggers:
- type: redis
metadata:
address: redis.demo:6379
listName: jobs
listLength: "5"
kubectl apply -f scaledobject.yaml
步骤4:压测注入消息
for i in {1..500}; do
kubectl exec deploy/redis -n demo -- \
redis-cli LPUSH jobs "task-$i"
done
观察:
watch kubectl get hpa,deploy -n demo
- 队列 >5 时,Pod 秒级扩容
- 消费完毕自动缩回 0
步骤5:改造 HTTP QPS 触发
安装 Prometheus Adapter:
helm install adapter prometheus-community/kube-prometheus-stack \
-n monitoring --set prometheus.prometheusSpec.serviceMonitorSelectorNilUsesHelmValues=false
定义自定义指标:
apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
name: api-scaler
namespace: demo
spec:
scaleTargetRef:
name: api
cooldownPeriod: 60
pollingInterval: 15
maxReplicaCount: 20
triggers:
- type: prometheus
metadata:
serverAddress: http://prometheus.monitoring:9090
query: |
sum(rate(http_requests_total{app="api"}[1m]))
threshold: "150"
步骤6:开启预热(Warm-up)
advanced:
restoreToOriginalReplicaCount: true
horizontalPodAutoscalerConfig:
behavior:
scaleUp:
stabilizationWindowSeconds: 0
policies:
- type: Pods
value: 5
periodSeconds: 30
防止冷启动导致高延迟。
步骤7:生产级优化
项 | 建议 |
日志 | kubectl logs -n keda deploy/keda-operator 快速定位规则 |
可观测 | 导入官方 Grafana Dashboard 12465 监控 Scaler 延迟 |
HA | KEDA Operator 副本数调 3,LeaderElection on |
多租户 | triggerAuthentication 绑定独立 Secret,避免凭据串用 |
五、效果对比
场景 | 原始 3Pod 固定 | KEDA 动态 0-30 | 资源节省 |
平峰(QPS10) | 3Pod × 100m = 300m | 0Pod | 100% |
高峰(QPS800) | 3Pod CPU 饱和,延迟 800ms | 25Pod,延迟 120ms | 延迟 ↓85% |
六、总结
借助 KEDA,“扩容”不再局限 CPU/内存,而真正以“业务事件”驱动,让你的 Kubernetes 集群 按需呼吸。跟着本指南 7步,你就能在 30分钟内完成落地,最多节省 70% 资源账单,还能在高峰时刻保持丝滑体验。赶快把 HPA 升级到 Event-Driven 时代吧!
相关推荐
- 几种 TCP 连接中出现 RST 的情况
-
现在是一个网络时代了。应该不少程序员在编程中需要考虑多机、局域网、广域网的各种问题。所以网络知识也是避免不了学习的。而且笔者一直觉得TCP/IP网络知识在一个程序员知识体系中必需占有一席之地的。在...
- Redis连接使用报RDB error错误
-
该错误信息:Errorinexecution;nestedexceptionisio.lettuce.core.RedisCommandExecutionException:MISC...
- lua 语法介绍与 NGINX lua 高级用法实战操作
-
一、概述lua是一种轻量小巧的脚本语言,用标准C语言编写并以源代码形式开放,其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能。官网:https://www.lua.org/二、l...
- Python教程——20.协程 - 2
-
异步编程asyncio.Future对象Task继承Future,Task对象内部中的await结果的处理基于Future对象来的在Future对象中会保存当前执行的这个协程任务的状态,如果当...
- “我的足迹”、“浏览历史”,Redis如何快速记录与展示?
-
咱们在网上“买买买”、“逛逛逛”的时候,总会留下各种各样的“足迹”。无论是电商APP里你最近浏览过的商品,视频网站上你刚刚看过的剧集,还是新闻客户端里你点开过的文章……这些“历史记录”,有时候还真挺有...
- 你手机上的“消息推送”,Redis可能参与其中
-
手机上那些时不时就“叮咚”一下的消息推送,确实是咱们数字生活里不可或缺的一部分。这篇咱们就来聊聊,Redis这位“消息灵通人士”,是如何在这场“信息接力赛”中大显身手,确保那些重要的、有趣的通知,能够...
- 短视频APP的“附近的人”,Redis如何快速匹配?
-
刷短视频,除了看各种搞笑段子、才艺展示,有时候是不是也想看看“同城”或者“附近”的人都在发些啥有意思的内容?或者,平台也会时不时地给你推荐一些“附近正在直播”的主播,让你感觉一下子拉近了和这个虚拟世界...
- 微信朋友圈的点赞、评论,Redis在背后默默付出
-
微信朋友圈,这片小小的“自留地”,承载了我们多少喜怒哀乐、生活点滴啊!一张精心修饰的照片,一段随感而发的文字,发出去之后,最期待的是什么?那必须是屏幕下方不断冒出来的小红心和一条条真诚(或者商业互吹)...
- 网站登录老是掉线?Redis帮你记住你是谁!
-
有没有过这样的糟心体验?你好不容易登录了一个网站,刚看了两篇帖子,或者购物车里刚加了几件宝贝,结果一刷新页面,或者稍微离开了一会儿,回来就发现——“哎?我怎么又退出了?!”又得重新输入用户名、密码、...
- 你常用的APP,哪些地方可能用到了Redis?(猜想与分析)
-
咱们现在的生活,简直是离不开各种各样的手机APP了!从早上睁眼刷新闻,到中午点外卖,再到晚上刷短视频、玩游戏,一天到头,指尖在屏幕上就没停过。这些APP为了让我们用得爽、用得顺心,背后可是使出了浑身解...
- Redis是啥?为啥程序员天天挂嘴边?小白也能看懂!
-
这Redis到底是何方神圣?为啥那些天天在电脑前敲代码的程序员小哥哥小姐姐们,老是把它挂在嘴边,好像离了它地球都不转了似的?别担心,咱们今天不说那些听了就头大的代码和术语,就用大白话,保证你听完一拍大...
- 面试官:请你说说Redis为什么这么快?
-
1)Redis是基于内存的存储数据库,绝大部分的命令处理只是纯粹的内存操作,内存的读写速度非常快。2)Redis是单进程线程的服务(实际上一个正在运行的RedisServer肯定不止一个线程,但只有...
- 有了强大的关系型数据库,为什么还需要Redis?
-
在数字世界的浩瀚海洋中,关系型数据库,例如我们熟知的MySQL、PostgreSQL或Oracle,无疑是那些承载着核心业务数据、坚如磐石的“国家图书馆”或“银行金库”。它们以严谨的结构、强大的事务处...
- Java 中间件数据可靠性串讲:从 MQ 、MySQL、Redis 不丢失的保障之道
-
引言在现代分布式系统中,中间件扮演着至关重要的角色,它们是构建高可用、高性能、高可扩展应用架构的基石。消息队列(MQ)、数据库(如MySQL)、缓存(如Redis)等是其中最具代表性的组件。然而,...
- 运维部署方式之——虚机部署
-
标准化使用作業系统:LinuxCentOS7自动化方式通过Ansible系统初始化playbook来管理。目的系统初始化工作是一个简单、繁复的工作,从云网得到的虚拟主机只是一个基础的系统环境,...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)