应用现代化中的弹性伸缩

以下文章来源于享受生活的云计算工程师，作者云原生 iWEI

享受生活的云计算工程师.

分享云计算技术，游记，游戏，吃喝玩乐

❝
作者：马伟，青云科技容器顾问，云原生爱好者，目前专注于云原生技术，云原生领域技术栈涉及 Kubernetes、KubeSphere、KubeKey 等。

2019 年，我在给很多企业部署虚拟化，介绍虚拟网络和虚拟存储。

2023 年，这些企业都已经上了云原生了。对于高流量的 Web 应用程序，实时数据分析，大规模数据处理、移动应用程序等业务，容器比虚拟机更适合，因为它轻量级，快速响应，可轻松移植，并具有很强的弹性伸缩能力。

为什么需要弹性伸缩呢？

峰值负载应对：促销活动、节假日购物季或突发事件根据需求快速扩展资源，保证应用可用性和性能。
提高资源利用率：根据实际资源负载动态调整资源规模，避免基础设施资源浪费，降低 TCO。
应对故障和容错：多实例部署和快速替换，提高业务连续性和可用性。
跟随需求变化：匹配前端的业务需求及压力，快速调整规模，提高事件应对能力，满足需求和期望。

Horizontal Pod Autoscaling

Kubernetes 自身提供一种弹性伸缩的机制，包括 Vertical Pod Autoscaler (VPA)和 Horizontal Pod Autoscaler (HPA)。HPA 根据 CPU 、内存利用率增加或减少副本控制器的 pod 数量，它是一个扩缩资源规模的功能特性。

HPA 依赖 Metrics-Server 捕获 CPU、内存数据来提供资源使用测量数据，也可以根据自定义指标（如 Prometheus）进行扩缩。

由上图看出，HPA 持续监控 Metrics-Server 的指标情况，然后计算所需的副本数动态调整资源副本，实现设置目标资源值的水平伸缩。

但也有一定局限性：

无外部指标支持。如不同的事件源，不同的中间件/应用程序等，业务端的应用程序变化及依赖是多样的，不只是基于 CPU 和内存扩展。
无法 1->0。应用程序总有 0 负载的时候，此时不能不运行工作负载吗？

所以就有了 Kubernetes-based Event-Driven Autoscaling（KEDA）！

KEDA

KEDA 基于事件驱动进行自动伸缩。什么是事件驱动？我理解是对系统上的各种事件做出反应并采取相应行动（伸缩）。那么 KEDA 就是一个 HPA+多种触发器。只要触发器收到某个事件被触发，KEDA 就可以使用 HPA 进行自动伸缩了，并且，KEDA 可以 1-0，0-1!

架构

KEDA 自身有几个组件：

Agent: KEDA 激活和停止 Kubernetes 工作负载（keda-operator 主要功能）
Metrics: KEDA 作为一个 Kubernetes 指标服务器，向 Horizontal Pod Autoscaler 提供丰富的事件数据，从源头上消费事件。（keda-operator-metrics-apiserver 主要作用）。
Admission Webhooks: 自动验证资源变化，以防止错误配置。
Event sources: KEDA 更改 pod 数量的外部事件/触发源。如 Prometheus、Kafka。
Scalers: 监视事件源，获取指标并根据事件触发伸缩。
Metrics adapter:从 Scalers 获取指标并发送给 HPA。
Controller: 根据 Adapter 提供的指标进行操作，调谐到 ScaledObject 中指定的资源状态。Scaler 根据 ScaledObject 中设置的事件源持续监视事件，发生任何触发事件时将指标传递给 Metrics Adapter。Metrics Adapter 调整指标并提供给 Controller 组件，Controller 根据 ScaledObject 中设置的缩放规则扩大或缩小 Deployment。

总的来说，KEDA 设置一个 ScaledObject，定义一个事件触发器，可以是来自消息队列的消息、主题订阅的消息、存储队列的消息、事件网关的事件或自定义的触发器。基于这些事件来自动调整应用程序的副本数量或处理程序的资源配置，以根据实际负载情况实现弹性伸缩。

CRD

ScaledObjects：代表事件源（如 Rabbit MQ）和 Kubernetes。Deployment、StatefulSet 或任何定义 / 规模子资源的自定义资源之间的所需映射。
ScaledJobs：事件源和 Kubernetes Jobs 之间的映射。根据事件触发调整 Job 规模。
TriggerAuthentications：触发器的认证参数。
ClusterTriggerAuthentications：集群维度认证。

部署 KEDA

helm repo add kedacore https://kedacore.github.io/charts
helm repo update
kubectl create namespace keda
helm install keda kedacore/keda --namespace keda

kubectl apply -f https://github.com/kedacore/keda/releases/download/v2.10.1/keda-2.10.1.yaml

root@node-1:/# kubectl get all -n keda
NAME                                          READY   STATUS    RESTARTS   AGE
pod/keda-metrics-apiserver-7d89dbcb54-v22nl   1/1     Running   0          44s
pod/keda-operator-5bb9b49d7c-kh6wt            0/1     Running   0          44s

NAME                             TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)          AGE
service/keda-metrics-apiserver   ClusterIP   10.233.44.19           443/TCP,80/TCP   45s

NAME                                     READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/keda-metrics-apiserver   1/1     1            1           45s
deployment.apps/keda-operator            0/1     1            0           45s

NAME                                                DESIRED   CURRENT   READY   AGE
replicaset.apps/keda-metrics-apiserver-7d89dbcb54   1         1         1       45s
replicaset.apps/keda-operator-5bb9b49d7c            1         1         0       45s
root@node-1:/# kubectl get all -n keda
NAME                                          READY   STATUS    RESTARTS   AGE
pod/keda-metrics-apiserver-7d89dbcb54-v22nl   1/1     Running   0          4m8s
pod/keda-operator-5bb9b49d7c-kh6wt            1/1     Running   0          4m8s

NAME                             TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)          AGE
service/keda-metrics-apiserver   ClusterIP   10.233.44.19           443/TCP,80/TCP   4m9s

NAME                                     READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/keda-metrics-apiserver   1/1     1            1           4m9s
deployment.apps/keda-operator            1/1     1            1           4m9s

NAME                                                DESIRED   CURRENT   READY   AGE
replicaset.apps/keda-metrics-apiserver-7d89dbcb54   1         1         1       4m9s
replicaset.apps/keda-operator-5bb9b49d7c

# kubectl get crd | grep keda
clustertriggerauthentications.keda.sh                     2023-05-11T09:26:06Z
scaledjobs.keda.sh                                        2023-05-11T09:26:07Z
scaledobjects.keda.sh                                     2023-05-11T09:26:07Z
triggerauthentications.keda.sh                            2023-05-11T09:26:07Z

KubeSphere 部署 KEDA

kubectl edit cc -n kubesphere-system (kubesphere 3.4+)
spec:
···
  autoscaling:
    enabled: true
···

扩展工作负载 CRD

ScaledObject 资源定义，详情参数请看：https://keda.sh/docs/2.10/concepts/scaling-deployments/。

apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
  name: {scaled-object-name}
spec:
  scaleTargetRef:
    apiVersion:    {api-version-of-target-resource}  # Optional. Default: apps/v1
    kind:          {kind-of-target-resource}         # Optional. Default: Deployment
    name:          {name-of-target-resource}         # Mandatory. Must be in the same namespace as the ScaledObject
    envSourceContainerName: {container-name}         # Optional. Default: .spec.template.spec.containers[0]
  pollingInterval:  30                               # Optional. Default: 30 seconds
  cooldownPeriod:   300                              # Optional. Default: 300 seconds
  idleReplicaCount: 0                                # Optional. Default: ignored, must be less than minReplicaCount
  minReplicaCount:  1                                # Optional. Default: 0
  maxReplicaCount:  100                              # Optional. Default: 100
  fallback:                                          # Optional. Section to specify fallback options
    failureThreshold: 3                              # Mandatory if fallback section is included
    replicas: 6                                      # Mandatory if fallback section is included
  advanced:                                          # Optional. Section to specify advanced options
    restoreToOriginalReplicaCount: true/false        # Optional. Default: false
    horizontalPodAutoscalerConfig:                   # Optional. Section to specify HPA related options
      name: {name-of-hpa-resource}                   # Optional. Default: keda-hpa-{scaled-object-name}
      behavior:                                      # Optional. Use to modify HPA's scaling behavior
        scaleDown:
          stabilizationWindowSeconds: 300
          policies:
          - type: Percent
            value: 100
            periodSeconds: 15
  triggers:
  # {list of triggers to activate scaling of the target resource}

查看 KEDA Mterics Server 暴露的指标

kubectl get --raw "/apis/external.metrics.k8s.io/v1beta1"

Demo

KEDA 目前支持 53 种 Scalers，如 Kafka，Elasticsearch，MySQL，RabbitMQ，Prometheus 等等。此处演示一个 Prometheus 和 Kafka 的例子。

Prometheus & KEDA

部署一个 Web 应用，使用 Prometheus 监控 Web 应用 http 请求指标。

为寻求演示效果，此处部署了一个有点击，互动的 Demo APP，地址如下：https://github.com/livewyer-ops/keda-demo/blob/v1.0.0/examples/keda/。

部署成功后通过 NodePort 访问：

进入 KubeSphere 项目，新建一个自定义伸缩：

设置最小副本数为 1，最大副本数为 10，轮询间隔 5 秒，等待时间为 1 分钟：

KubeSphere 支持 Cron、Prometheus，和自定义触发器：

触发器设置 Prometheus，设置请求为 30s 内的增长率总和，当阈值大于 3 时事件驱动触发缩放：

设置一些其他设置，如资源删除后是否恢复指本来的副本数，以及扩缩策略设置：

现在并发访问 Web App：

可以在自定义监控看到监控指标的变化：

Web App 的副本数开始横向扩展：

最终扩展到 ScaledObject 中定义的 10 个副本：

在访问停止后，可以看到监控指标的数值在慢慢变小：

Deployment 开始缩容：

Kafka & KEDA

KEDA 使用 Kafka 事件源演示的整体拓扑如下：

Kafka 使用 Demo 代码：https://github.com/ChamilaLiyanage/kafka-keda-example.git。

部署 Kafka

打开 KubeSphere 应用商店，查看 DMP 数据库中心：

选择 Kafka，进行安装：

安装好 Kafka 后，创建一个测试的 Kafka Topic，Topic 分区设置为 5，副本设置为 1：

创建 Kafka Producer 服务：

向主题发送订单：

创建 Consumer 服务：

发送新订单看 Consumer 服务是否消费：

现在可以来做自动伸缩了，创建一个 ScaledObject，设置最小副本数为 0，最大为 10，轮询间隔为 5s，Kafka LagThreshold 为 10：

apiVersion: keda.k8s.io/v1alpha1
kind: ScaledObject
metadata:
  name: kafka-scaledobject
  namespace: default
  labels:
    deploymentName: kafka-consumer-deployment # Required Name of the deployment we want to scale.
spec:
  scaleTargetRef:
    deploymentName: kafka-consumer-deployment # Required Name of the deployment we want to scale.
  pollingInterval: 5
  minReplicaCount: 0   #Optional Default 0
  maxReplicaCount: 10  #Optional Default 100
  triggers:
  - type: kafka
    metadata:
      # Required
      BootstrapeServers: radondb-kafka-kafka-external-bootstrap.demo:9092 # Kafka bootstrap server host and port
      consumerGroup: order-shipper  # Make sure that this consumer group name is the same one as the one that is consuming topics
      topic: test
      lagThreshold: "10" # Optional. How much the stream is lagging on the current consumer group

创建自定义伸缩：

现在，让我们向队列提交大约 100,000 条订单消息，看看自动缩放的实际效果。你会看到随着队列中多余消息的增长，将会产生更多的 kafka-consumer pod。

NAMESPACE NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
demo keda-hpa-kafka-consumer Deployment/kafka-consumer 5/10 (avg) 1 10 1 2m35s

此处我们看到最大到 5 个副本，没有到 10 个副本，因为默认最大副本数不会超过 Kafka 主题分区数量，上面设置了分区为 5，可以激活 allowIdleConsumers: true 来禁用这个默认行为。重新编辑自定义伸缩后，最大副本变化成 10：

在无消息消费时，副本变化为 0：

结尾

到这里本篇就结束了，对此有需求或感兴趣的小伙伴可以操练起来了。

关于 KubeSphere

KubeSphere （https://kubesphere.io）是在 Kubernetes 之上构建的开源容器平台，提供全栈的 IT 自动化运维的能力，简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、爱立信、本来生活、东软、华云、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能，包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能，帮助企业快速构建一个强大和功能丰富的容器云平台。

展开阅读全文

页面更新：2024-04-13

标签：伸缩触发器队列副本负载应用程序弹性指标消息事件资源

1 2 3 4 5

应用现代化中的弹性伸缩

Horizontal Pod Autoscaling

KEDA

架构

CRD

部署 KEDA

KubeSphere 部署 KEDA

扩展工作负载 CRD

查看 KEDA Mterics Server 暴露的指标

Demo

Prometheus & KEDA

Kafka & KEDA

部署 Kafka

结尾

“遥控”百公里外港口 8K影像接入房间 “光联万物”，未来场景扑面而来

517世界电信日｜从“闻其声”到“全互动” 中国广电发布《5G新通话白皮书》

北京每万人拥有5G基站数全国第一

阿里国际站提升课：详解数据参谋 - 流量助手功能

医药O2O的佣金大战，谁是王者、谁是青铜？

苹果手机用户警惕，已有人被骗

.net环境下跨进程、高频率读写数据

益倍智：被动养生鞋虚假宣传，五级分销、团队计酬涉嫌违法违规

某平台“隔日净”把近万元的羽绒服洗到结团仅赔6元？多方回应

“IFC数字货币交易所”拉人头返现涉嫌传销，远离小交易所！

04、Spring之Bean生命周期源码解读下

中国移动早期号码迎来“升值”？“139”、“138”开头，你有吗？

境外“实力强大”国际集团在境内开展非法互联网理财活动：警惕！

专家解读互联网广告新规执行层面是“技术活”也是“细致活”

aigc巨火的AIGC，到底有多厉害？

好消息！6月1日起，这项费用降低了

3560万！一夜7消息：哈登跳出合同，太阳留下保罗！湖人G2寻变

正式官宣！中国女足陷下下签，冲击奥运收坏消息，遇两劲敌围

NBA三大消息：哈登的未来去向三选一，文班亚马潜在选秀球

消息称边缘AI芯片竞争正在升温

2022年山东省人力资源服务业年营收1338亿元年营收过

人民币汇率突发大消息！官方紧急出手

泽连斯基遭遇“背刺”，俄乌冲突最大的乌龙事件国际看

CBA新消息！乔尔杰维奇挑选4人加入中国男篮，上海将引入黎

好消息！国产车攻占多个发达国家市场，家用和商用车迎来新