破译混合云架构的关键点:云数据传输

混合云架构融合了私有云和公有云,如何部署混合云已经成为IT圈里面最热门的话题之一。大部分数据中心团队都发现这种架构在技术上具有极大的挑战,这些挑战主要源于各种工具的不成熟和云产品的快速发展。

出于各种原因,IT团队需要将云资源同时分配在私有云和公有云上,从而产生了混合云。其中首要原因是云爆发。云爆发指应用运行在私有云或数据中心中,当私有云计算能力达到顶峰时按需加入公有云资源。除此之外还有经济原因,公有云能降低资源开销,同时也能降低维护成本。

解决峰值业务的访问

对企业来说,在公有云服务提供商(如亚马逊云服务Amazon Web Service)上创建额外的公有云资源是非常有吸引力的,因为企业数据中心只需要部署支持平均负载的私有云资源,而不需要为了应付峰值负载而过度部署。业务的峰值负载往往超过均值负载的20%-50%,甚至更多,因此利用公有云可以极大程度上避免低利用率的资源开销,特别是对于峰值发生较少的情况。

企业乐于节约开销,并且倾向于具有高度灵活性的公有云资源——大量低成本资源能够秒级启动秒级终止,这一细节至关重要。

随着数据量逐日增加,企业业务对数据已经产生极大的依赖性。迁移TB级别的数据需要很长时间,尤其是当即启即用的公有云计算实例需要访问私有云上的大批数据时,我们遇到过很多麻烦。

云数据传输慢的主要原因在于网络带宽。我们目前没有足够的带宽支持快速的云数据传输。这个限制使我们在需要云爆发(负载超过私有云极限)时不能及时将数据拷贝到用于扩展的云资源上,成为混合云使用的一大难点。

对于上述问题,目前最热门的混合云部署实例是数据波动(data volatility)。这种场景中,我们首先决定是否需要分别在公有云和私有云中部署多份同样的数据。如果需要的话,如何保持多份数据的一致性,是一个非常困难的挑战。因为任何传统的数据锁操作,在远程执行时,都会使数据访问变得非常慢。

如何解决访问慢的问题?如果数据库中大部分数据都是固定不变的,比如历史数据,剩下的小部分数据是会缓慢变化的,比如价格列表、描述信息等,那么IT团队仅仅需要在访问一致性数据时才进行同时访问多个数据库的慢操作,例如查询资产可用情况。对于不需要保持一致性的数据,IT团队可以异步访问,或者访问本地数据库副本。这种优化访问需要根据业务特点设计数据存取的方式,它的好处是毋庸置疑的,因为访问本地数据库副本的WAN传输速度肯定比访问异地数据库的运营商网络快。

还有另一种可以参考的混合云部署方法:将数据以主机托管模式(colocate)部署到电信服务提供商的机房,或者其他拥有快速连接公有云网络的设施中。这种部署方式使数据离公有云更近,公有云可通过10GbE或40GbE局域网快速访问数据,但私有云端访问数据速度将受制于较慢的WAN连接。

数据安全问题

将私有云的部分或者全部都迁移到拥有良好网络的主机托管环境中,能极大地解决混合云架构的性能问题。为了实现这种迁移,首先需要保证数据安全性。问题主要出现在加密方面,因为需要对传输和静态存储中的所有数据加密。

如果没有硬件加速,加密会极大地影响性能从而使我们不能经常使用。有一种方式对性能影响不大,就是通过磁盘加密技术实现静态存储数据加密,因为它只在存储端执行。虽然该方式下数据写盘不产生额外的时延,但该方式已被证明是不安全的,因此不推荐使用。在主机托管模式中,服务器端加密是非常必要的。

在主机托管模式中,你还将面对私有云和公有云之间交互的瓶颈问题,特别是在数据更新方面。由于数据锁操作和两地传输,很容易积累起百毫秒级别的时延。一种解决方案是将私有云的一部分资源(不单单是数据)部署到主机托管环境中,可以是由云服务商提供并维护这些资源,也可以直接购买服务商提供的服务器。

各大数据库提供商不断在数据安全方面重点投资,主机托管模式已经成为一种安全的部署方式。随着目前云服务价格战的继续,这种方式将会成为最经济的解决方案。

本文转自d1net(转载)

上一篇:ELK菜鸟手记 (四) - 利用filebeat和不同端口把不同服务器上的log4j日志传输到同一台ELK服务器


下一篇:HTTP权威指南阅读笔记二:URL与资源