作者:范军 (Frank Fan) 新浪微博:@frankfan7
从本文开始,我们将介绍一系列的关于容灾的解决方案。先探讨应用的场景,然后再深入介绍技术架构。
情景一:
某小型公司的虚拟化环境中,在5台ESXi服务器上运行100台虚拟机。采用NFS存储。其中需要异地恢复的虚拟机10台。对于异地容灾RPO的要求是30分钟,RTO是1小时。已经使用vSphereStandard 许可。软件购买成本有限。
建议:
采用vSphere Replication (VR)
VR对于已经使用vSphere essential 以上许可的用户是免费的。 VR能够满足RPO30分钟的要求。
技术细节:
VR适用于本地的恢复,或者异地恢复。异地场景如下图所示:
VR的全部功能是有VR Appliance来实现的。VR Appliance和安装在每个ESXi上的VRA通讯,在第一次的数据同步完成后(baselineSynchronization),仅仅传送以后更改的数据到异地。
考虑因素:
以下虚拟机是不适合使用VR来容灾的:
AD,DNS, LDAP 等两地共享的虚拟机
vCenter
RPO要求<15 分钟
Physical RDM
情景二:
某大型公司的虚拟化环境较复杂,在50台ESXi服务器上运行1500台虚拟机。采用SAN。其中需要异地恢复的虚拟机100台。对于异地容灾要求RPO 30分钟。 RTO是20分钟。
建议:
采用VMware Site Recovery Manager (SRM)
尽管VR也能满足30分钟RPO的要求,但较难实现100台虚拟机在20分钟内完全在异地恢复(RTO=20分钟)。因为VR的恢复是人工来操作的。
SRM完全可以实现预先设定恢复的工作流,并充分测试。需要是只需要一键触发恢复,完全在后台自动完成。当然SRM需要额外购买许可。注意VR和SRM可以一同使用。
技术细节:
SRM是一个Orchestrator, 设计工作流并且执行恢复的动作。数据的同步是依赖于和存储设备直接通讯的SRA
考虑因素:
设计相对比VR要复杂
存储设备需要支持SRM
参考:
VMworld 2013: Session BCO5129- Protection for All