前言
弹性伸缩是Kubernetes中比较常用的功能。在Kubernetes中,弹性是分为两个层次的,一个是调度层(Pod)弹性,一个是资源层(Node)弹性。通常会通过HPA、CronHPA、VPA等模型进行Pod的横向或者纵向的伸缩,再通过cluster-autoscaler
或者virtual-kubelet
进行资源层伸缩。两层之间是通过无法调度的Pod
进行解耦,这样设计的好处是两层职责明确,坏处是解耦后相互结合的策略过于简单,一旦当我们需要更精细的调度策略就无能为力了,因为在Kubernetes中最小的生命周期管理单元是一个Pod,而传统的Kubernetes负载控制器(例如:Deployment、StatefulSet)管理的Pod是共享相同的调度策略的。因此,当你希望控制一个负载在不同资源上的细粒度分配时,就无能为力了。然而这种场景又是在弹性伸缩中经常遇到的。因此,为了解决应用负载弹性场景下精细化调度的诉求,kubernetes-elastic-workload
应运而生了。
弹性伸缩精细化调度的问题分析
假设:有一个应用经过容量规划,预计最多有4个副本运行在ECS上,平时低峰时保留2个副本,超过4个副本的场景弹性伸缩到虚拟节点,防止干扰其他正常容量规划的应用。
在Kubernetes中,任何一种负载都要解决两个问题,一个是调度问题,一个是生命周期管理问题。要想实现上面描述的场景,我们核心要解决的问题是两个:
- 如何控制副本到达一个数目后,调度策略的变化。
- 如何在生命周期管理时,优先处理某些Pod。
弹性负载kubernetes-elastic-workload介绍
接下来,我们针对上面的问题介绍下弹性负载的使用方式与解决方法。
# 一个简单的应用,默认使用2副本
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment-basic
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.7.9
ports:
- containerPort: 80
那么这个场景如何用弹性负载表达呢?
# 弹性负载定义
apiVersion: autoscaling.alibabacloud.com/v1beta1
kind: ElasticWorkload
metadata:
name: elasticworkload-sample
spec:
sourceTarget:
name: nginx-deployment-basic
kind: Deployment
apiVersion: apps/v1
min: 2
max: 4
replicas: 6
elasticUnit:
- name: virtual-kubelet
labels:
virtual-kubelet: "true"
annotations:
virtual-kubelet: "true"
nodeSelector:
type: "virtual-kubelet"
tolerations:
- key: "virtual-kubelet.io/provider"
operator: "Exists"
# min: 0 每个单元也可以指定自己的上下限
# max: 10
上面就是这个场景的弹性负载定义,弹性负载的使用方式特别像HPA,他是通过外部挂载的方式使用,对原有的业务无侵入。一个典型的弹性负载主要分为两个部分:
- SourceTarget部分主要定义原始负载的类型、副本数目可变化的范围。
- elasticUnit部分是一个数组,定义弹性单元的调度策略,如果有多个弹性单元,则按照模板的顺序定义。
在上面的例子中,SourceTarget的副本上下限位2-4,表示当ElasticWorkload的replicas为2-4个副本时,会分配到sourceTarget,当超过4个副本时,会分为给弹性单元virtual-kubelet,而在弹性单元virtual-kubelet中可以定义这个单元所独有的调度策略,包含label
、annotation
、nodeSelector
、affinity
、toleration
等。
简单的理解就是,弹性负载会监听原始负载,并根据弹性单元设定的调度策略,克隆并生成弹性单元的负载,并且根据弹性负载中副本的变化,动态的分配原始负载和弹性单元上面的副本数目。执行弹性负载模板后,我们可以通过命令行查看当前的状态,其中status中的每个单元的Desired Replicas
表示弹性负载的分配副本数目。
kubectl describe ew elasticworkload-sample # same as kubectl get elasticworkload
Name: elasticworkload-sample
Namespace: default
Labels: <none>
Annotations: <none>
API Version: autoscaling.alibabacloud.com/v1beta1
Kind: ElasticWorkload
Metadata:
Creation Timestamp: 2020-05-06T03:43:41Z
Generation: 27
Resource Version: 20635284
Self Link: /apis/autoscaling.alibabacloud.com/v1beta1/namespaces/default/elasticworkloads/elasticworkload-sample
UID: 0e9205ff-38b8-43b7-9076-ffa130f26ef4
Spec:
Elastic Unit:
Annotations:
Virtual - Kubelet: true
Labels:
Virtual - Kubelet: true
Name: demo
Node Selector:
Type: virtual-kubelet
Tolerations:
Key: virtual-kubelet.io/provider
Operator: Exists
Replicas: 6
Source Target:
API Version: apps/v1
Kind: Deployment
Max: 2
Min: 0
Name: nginx-deployment-basic
Status:
Elastic Units Status:
Desired Replicas: 4
Name: nginx-deployment-basic-unit-virtual-kubelet
Update Timestamp: 2020-05-07T12:38:27Z
Replicas: 6
Selector: app=nginx
Source Target:
API Version: apps/v1
Desired Replicas: 2
Kind: Deployment
Name: nginx-deployment-basic
Update Timestamp: 2020-05-07T12:38:27Z
Events: <none>
当我们下发弹性负载的模板后,可以查看Pod的情况。可以发现弹性负载克隆出了新的Deployment与Pod,并且Deployment的Pod副本数目是根据上述的规则进行动态分配的。
kubectl get pod -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
nginx-deployment-basic-7ff9955f89-djxwv 1/1 Running 0 138m 172.20.1.151 cn-hangzhou.10.0.5.212 <none> <none>
nginx-deployment-basic-7ff9955f89-hrw2z 1/1 Running 0 138m 172.20.1.27 cn-hangzhou.10.0.5.208 <none> <none>
nginx-deployment-basic-unit-demo-8bb586568-4f8xt 1/1 Running 0 138m 10.1.76.63 virtual-node-eci-1 <none> <none>
nginx-deployment-basic-unit-demo-8bb586568-bl5pd 1/1 Running 0 138m 10.1.76.65 virtual-node-eci-0 <none> <none>
nginx-deployment-basic-unit-demo-8bb586568-ndbp8 1/1 Running 0 138m 10.1.76.64 virtual-node-eci-0 <none> <none>
nginx-deployment-basic-unit-demo-8bb586568-vx9jx 1/1 Running 0 138m 10.1.76.62 virtual-node-eci-2 <none> <none>
此外,弹性负载也支持与HPA配合使用,可以将HPA作用在弹性负载上,如下图,弹性负载会根据HPA的状态动态调整每个单元的副本分布,例如如果当前是从6个副本缩容到4个副本,那么会优先将弹性单元的副本进行缩容。
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
name: elastic-workload-demo
namespace: default
spec:
scaleTargetRef:
apiVersion: autoscaling.alibabacloud.com/v1beta1
kind: ElasticWorkload
name: elasticworkload-sample
minReplicas: 2
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 50
总结一下,首先弹性负载是通过克隆和覆写调度策略的方式生成多个Deployment,实现了调度策略的管理。其次,通过上层的副本计算,调整原始负载和弹性单元的副本分配,实现了针对一部分Pod的优先处理。从而解决了上述的问题。
弹性负载的安装与使用
弹性负载在阿里云容器服务控制台已经默认集成,可以通过应用市场进行安装,在应用目录中搜索ack-kubernetes-elastic-workload
即可。
无需修改参数,点击创建即可。
最后
弹性负载所能解决的问题还远不止文中提到的这些,如果我们从更抽象的角度来看到弹性负载,实际上,弹性负载主要是解决了精细化调度和控制器顺序的问题,因此开发者可以基于弹性负载在例如故障恢复、可用区容灾等等场景下进行进一步的开发和使用。在下一篇文章中,我们会来介绍弹性负载的弹性策略,如何通过弹性策略的设置实现容灾。