疫情期间云沃客使用阿里云k8s动态扩容实践

疫情期间云沃客使用阿里云k8s动态扩容实践
一.背景
在春节前后的武汉肺炎疫情的影响下,国家和地方*纷纷出台春节假期延期政策,鼓励有条件的企业在家办公,避免进入人口密集环境。我司北京云族佳科技有限公司数年来专注于云工作生态环境的建设与完善,先后推出云沃客,企业版,黄豆纳才,绩效监控等云产品,帮助企业及其成员在不同空间维度下协同开展工作,在云端最大限度的还原现场工作场景,现云沃克平台向所有企业无限制免费开放,至官宣疫情结束后90天。欢迎个人和企业用户入住云沃克平台。
为了应对突发的流量,我们决定将原来的技术架构予以升级,我们希望新的架构能够具有以下几个特征:
1.能够做到简装上阵,开发人员可以更专注于业务的开发,同时系统兼运维工程师负责部署和运维,而无需考虑过于复杂的架构设计。
2.能够全面的拥抱微服务,我们希望新的架构的各个模块能独立上线,部署,和分发
3.其次能够方便的迁移至公有云中
4.强大的横向扩展能力以对应激增流量
很自然的kubernetes(简称k8s)成为我们的首选方案
二.k8s简介
2.1 k8s是什么
它是谷歌推出的一个全新的基于容器技术的分布式架构领先方案,它是谷歌十几年来大规模应用容器技术的经验积累和升华的重要成果,k8s是谷歌严格保密十几年的秘密武器Brog的一个开源实现,这个久负盛名的Brog用于谷歌内部管理大规模的集群系统,它基于容器技术。随着2015年Brog的论文公开以及k8s的高调宣传,人们才得以窥视和了解它。
如果我们遵循k8s的设计思想,传统架构的那些与业务无关的底层代码和功能,研发人员可以不必再关注,比如我们不用再考虑负载均衡的选型和部署实施问题,不必考虑自行引入或者开发一套服务治理方案,k8s为我们做的已经够多了,实践表明,使用k8s能够减少我们30%的开发成本,使得研发人员更关注与实现业务本身,k8s提供了强大的自动化机制,运维难度和成本都大幅降低。
2.2 将k8s搬到云端
由于我司的服务大部分都部署在阿里云上 ,同时阿里云也提供了k8s集群的功能,现将公司业务搬到k8s上的过程予以记录。
1.首先创建集群,在阿里云的web页面点击创建
疫情期间云沃客使用阿里云k8s动态扩容实践

会看到,阿里云提供了多种集群方式工选择,其中我们根据自身情况,选择了标准的托管版本,即是集群的master节点由ACK(阿里云k8s容器服务)托管,而用户只需创建node节点即可,
疫情期间云沃客使用阿里云k8s动态扩容实践

这里我们选择新建三个ECS作为工作节点,由于k8s本身不处理网络细节,它要求所有pod可以直接通信,也就是不能通过NAT转化,在同一个大二层网络内通信,因此需要选择网络插件作为k8s底层的通信手段,这里选择广泛使用的Flannel插件,指定pod和service的CIDR,如无特殊需求,默认就行,
选择完毕后,等待一段时间,

在控制台上查看,集群已经成功创建。
疫情期间云沃客使用阿里云k8s动态扩容实践

2.在这个集群上创建我们的应用,在我们的使用场景中我们主要是提供restful api服务,因此我们选择无状态的应用
疫情期间云沃客使用阿里云k8s动态扩容实践

  1. 这里可以选择使用镜像创建,也可以使用模板创建,由于我们在测试环境部署过k8s,已经写好了一些yaml文件,故而我们选择使用模板创建,若是第一次使用k8s,可以使用使用镜像创建,

deployment的yaml文件如下
疫情期间云沃客使用阿里云k8s动态扩容实践

点击创建,如无异常,能看到
疫情期间云沃客使用阿里云k8s动态扩容实践

创建成功,同时可以点击编辑,来修改参数,比如限制资源的使用,加入存活和就绪检查
疫情期间云沃客使用阿里云k8s动态扩容实践

查看容器组可以看到

疫情期间云沃客使用阿里云k8s动态扩容实践
pod已经成功运行起来,
4.接着我们我们创建service,在service管理页面点击创建

疫情期间云沃客使用阿里云k8s动态扩容实践
service我们选择使用内网slb,选择关联到的无状态应用实例,添加端口映射列表,点击创建
无异常的化,

疫情期间云沃客使用阿里云k8s动态扩容实践

我们能得到服务的内网访问方式。将此地址提供给前端访问即可,至此,算是基本将此应用迁移到k8s中了。,通过k8s我们能方便快速的水平扩展,当流量升上来时,我只用增到副本的数量,反之减少副本的数量,后续会将其他应用陆续迁移到k8s中
2.3后续工作
1.通过ab工具压测一下此api的性能如何
2.通过jenkins集成打包,部署,更新过程。阿里云同时提供了镜像仓库工能,制作的镜像可以存入。
3.发现阿里云k8s集成了istio service mesh功能,后期会利用它做一些服务治理的工作,比如流量控制,灰度发布等。

上一篇:Kubernetes Operator深入详解


下一篇:在生产环境中使用Graylog日志系统所踩过的坑