云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。当您基于ECS云服务器搭建了业务系统,借助云计算的诸多优势和特性,可以实现对业务需求的敏捷响应和对业务连续性的有力保障。在此基础上,阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。
主动运维
阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。对于单台ECS实例, 阿里云承诺一个服务周期内单台ECS实例的服务可用性不低于99.95%;对于单地域多可用区,阿里云承诺一个服务周期内该单地域多可用区的服务可用性不低于99.99%。
我们知道,在基础设施层面,始终存在一些潜在因素如软件bug或硬件故障等会影响ECS实例的运行,因此为了保证上述高级别的服务可用性,除了云计算基础框架的高可用性设计以外,ECS主动运维不可或缺。主动运维作为ECS的隐形卫士,会主动对承载ECS实例运行的物理服务器做日常维护和故障检测,并尽可能通过在线或轮转升级的方式修复潜在的故障隐患,以持续提升系统可靠性、性能和安全防护能力,保障云服务器稳定运行。
但对于某些情况,物理服务器需要重启或停机维护,这时主动运维系统会向该服务器上的ECS用户发送消息通知,提示您的ECS实例需要重启迁移至健康的物理服务器之上。此前,用户接到这样的通知后需要提交工单联系客服人员授权处理,随着主动运维2.0的进化,这方面的体验得到多方面的提升。
体验升级
1. 主动运维热迁移,实例运行不中断
事半功倍
正如上面提到的体验改进,“事”半功倍,除了主动运维流程进化,还来源于系统事件的发布。系统事件有利于提升用户对于ECS运行状态变化的感知,并进行有针对性的操作来响应或规避事件对在行业务的影响。通过系统事件的闭环,将更多的运维场景标准化、自动化,让用户获得更好的额云上运维体验。
玩转系统事件,更多信息可参考
- 让运维更高效:关于ECS系统事件,了解系统事件
- ECS主动运维事件--让你HOLD住全场,收到主动运维通知怎么办,不用工单,控制台上全搞定
- 使用OpenAPI自动化处理ECS系统事件,OpenAPI走起,让程序自动化监控和处理系统事件