阿里云数字新基建系列——混合云架构(第1章-2)

1.2 云计算概述

在介绍云计算之前,我们需要问如下几个问题:

    • 云计算技术为何出现和存在?
    • 云计算短期发展方向是什么?
    • 云计算未来是否会存在?如果存在的话会是什么样子?

要回答这些问题,我们得回顾一下计算机发展历程,看看驱动计算机技术

发展的动因究竟是什么。

1.2.1 计算机简史

1.概述

计算机技术发展经历了一个漫长的过程,是人类思想穿透历史和未来的迷

雾,摆脱现实物理世界的桎梏,开启另一个全新虚拟世界的发展过程,是人类

思维的伟大胜利。

根据制造材料的不同,可以将计算机发展分为如下几个阶段。

第一阶段:原型计算机。

第二阶段:电子管计算机。

第三阶段:晶体管计算机。

第四阶段:集成电路计算机。

从这几个阶段的一些关键事件可以看出,计算机技术发展是渐进的过程,在这个过程中,从机械计算器的发明、布尔代数的出现,到图灵机模型、冯·诺依曼体系结构的提出,逐步奠定了计算机的理论基础,后面的电子管、晶体管、集成电路等技术的出现使计算机的物理基础越来越成熟,直至摩尔定律的出现,大大推进了计算机技术的发展,让人类快速迈入了信息时代。

2. 关键事件

时至今日,在计算机发展史上有两个关键事件仍然在深刻影响计算机性能的发展。

(1)冯·诺依曼体系结构

1945 年冯·诺依曼提出了著名的冯·诺依曼体系结构,如图1-1 所示。该结构明确了新机器由5 部分组成:运算器、逻辑控制装置、存储器、输入设备和输出设备。

阿里云数字新基建系列——混合云架构(第1章-2)

图1-1 冯·诺依曼体系结构

这种结构将计算单元和数据存储单元分离,通过将程序和数据一起存储在内存,并通过控制器来控制指令的加载和执行。这种体系结构为现代计算机结构奠定了基础,直到现在,计算机的设计仍然遵从该体系结构。

(2)摩尔定律

1965 年戈登·摩尔提出了日后影响业界半个多世纪的摩尔定律,至今它仍在推动计算机行业的发展。

接下来详细分析这两个事件是如何影响计算机性能的演进的。

1.2.2 计算机性能的决定因素

现代计算机本质上是按照冯·诺依曼体系结构处理数据的,在这种结构设计中负责计算的处理器和负责存储数据的存储器是分离的。CPU 的发展让计算性能提高得很快,但CPU 速度跟内存速度之间存在几个数量级的差别,而且由于物理性质限制,这种速度差别不可能弥合。这意味着有如下性能定律:

    • 只有计算集中才能提升性能。
    • 距离是计算的敌人,无论什么尺寸规模(CPU 和内存之间、内存和外设之间、计算机之间即各个物理尺度),相对计算性能来说,数据移动成本都很高,距离在很大程度上决定了计算性能。
    • 计算机性能的矛盾体现在高速CPU和低速内存及外设之间的矛盾上。

需要注意的是,这些定律不仅适用于单台计算机,而且适用于由很多计算机组成的集群。

毫无疑问,CPU 决定了计算机性能的上限。下面我们从CPU 的各个技术层面看看有哪些技术决定了其性能。

摩尔定律指出:当价格不变时,集成电路可容纳的晶体管数约每隔18 个月便会增加1 倍,性能也增加1 倍。

我们看看是哪些技术在提升计算机性能,具体有如下几个因素。

    • 集成电路的规模不断扩大,这是工艺制程水平的提高,在微观上缩短了晶体管器件的通信距离,提升了性能,降低了能耗。
    • 频率也决定了CPU 的性能,时钟频率从最初只有几MHz 提高到目前最高达3.XGHz,提高时钟频率让单位指令执行的时间缩短。
    • 总线技术革新大幅提高了数据传输效率,这表现在两个方面:

- 南北总线结构可以分离快速设备和慢速设备,提高总线运行效率。

- 增加总线带宽可以增加一次访问的数据量。

    • CPU 内的流水线技术有效提升了性能,这种技术可以在一个时钟周期内同时执行多个指令。
    • CPU Cache 的大量运用提高了数据传输效率。由于程序运行的局部性原理,Cache 能提高程序/ 数据的命中率,从而避免了从慢速的RAM 加载数据。
    • 多核的出现,通过水平扩充的方式增加了 CPU 的算力,这意味着通过CPU 频率提升性能方式的终结。
    • 虚拟化技术在提升性能的同时也带动了云计算的发展。

综上可以看出,计算机性能是从如下三个方面来提升的:

    • 工艺水平,具体表现为摩尔定律驱动的晶体管制程水平的提高。
    • 垂直扩展(scale-up),通过提高 CPU 内的各种技术点来提升单个 CPU核心的性能。
    • 水平扩展(scale-out),通过多核堆叠、虚拟化技术来提升性能。

当CPU 发展到一定阶段后,单纯通过工艺水平来提高其性能就会遇到瓶颈,工艺制程水平的提高让晶体管之间连接的物理距离变短,的确能提升整体性能,并且这种性能提升方式在集成电路发展早期非常有效,但在目前阶段工艺水平的改进对CPU 性能提升就不那么明显了。随着集成度的提高,工艺制程水平的提高会越来越难,直至最终到达晶体管尺寸的极限。

此外,通过CPU 内的技术改进所带来的性能提升也几乎走到了尽头,所以水平扩展就成了性能最后的救星了,这种方式是通过增加CPU 内的核心数和通过虚拟化技术虚拟多个CPU 来提升性能的。这条路到最后也很难走通,因为超过8 核后,多核对程序的加速功能就会逐渐减弱(对大部分非并行化运行的程序而言)。

总结起来就是,如果把多核CPU 的计算机看作一个计算节点,则意味着单个计算节点的性能是有上限的,而且从性价比角度来看,这个上限已经到来。但存在的问题是,数智时代对计算性能的需求日益增长,同时基于前面提到的性能定律:距离是计算的敌人,数据离计算单元越近性能会越好。所以,将海量的、有性能容量上限的单个计算节点集中互联在一起对外提供计算服务模式就应运而生了。

1.2.3 云计算发展趋势

1. 云计算简史

从2006 年谷歌提出云端计算的概念开始,云计算至今已经走过了15 年发展历程,在传统业务快速云化的需求推动下,云计算从最开始的虚拟化开始普及,以VMware ESXi、Microsoft HyperV 及开源的Xen、KVM 为主的虚拟化平台,通过vSwitch 将物理网络转换成虚拟网络,并使用VSAN、FC 或iSCSI 方式将异构存储池化,将存储和网络资源集中调度分配给虚拟机使用。在这一阶段,云计算基础设施都以私有化部署为主,运维人员是云资源的主要分配者,而开发人员和测试人员则是云资源的使用方,他们使用云资源的方式和使用传统物理机的方式基本上是相同的。资源的池化并没有给应用架构设计带来本质上的改变,但应用的虚拟化部署极大地提高了部署效率,并有效地提升了物理资源的利用率。

在云计算发展的第二阶段,引入软件定义网络(SDN)、软件定义存储(SDS)及容器化技术实现了基础设施即服务(IaaS),并通过命名空间和隧道标签协议等技术实现了多租户的资源隔离。由于IaaS 技术的日渐成熟,如关系型数据库、KV 数据库、消息中间件等通用的企业级产品被集成到IaaS 上向租户提供平台即服务(PaaS)的能力,用户可以通过统一的门户和标准化的API 接口自助申请使用IaaS 和PaaS 资源,实现应用的自动化部署。随着云计算技术的快速发展,传统烟囱式的架构开始向分布式云架构转变,单体式应用向轻量化转变被拆分成不同的服务模块,从物理机或虚拟机迁移到云主机和容器平台,以减小组件之间的耦合并降低组件故障带来的影响。数据库也逐渐从传统关系型数据库如Oracle 迁移到PG 和MySQL 等开源数据库,与数据库紧密相连的底层SAN 存储也逐步被分布式存储所替代。在这一阶段,各类基础云产品被业务系统抽离出来进行统一的编排和调度,DevOps 应运而生并得到了快速发展。在上云选择上,由于公有云具有产品丰富、按量付费、弹性伸缩和超大带宽等优势,特别适合中小企业及互联网企业使用,用户不需要花费高昂的成本和较长的时间周期来建造IDC,也不需要完备的IT 支撑体系,就可以在云上搭建自己的业务系统,大量用户开始选择使用公有云。公有云在这期间有了爆发式的增长。

在公有云快速增长的同时,私有云并没有停滞不前。由于法律合规、安全可控等需求,一些企业基于开源技术打造了适合自己的私有云平台,但维护一朵云需要大量的人力和财力投入,而且这朵云不一定能满足不同用户的各种个性化需求。为实现快速上云的目标,很多企业会采购厂商的云产品来进行私有云部署。不管是自研还是采购厂商的云平台,私有云部署都需要投入硬件和基础架构的运营成本,因此,这些企业在完成私有云建设的基础上,开始借助公有云的能力对外提供服务。在这一阶段混合的云计算能力被大量运用。

从2017 年开始,鉴于公有云具有竞争性的价格、性能等市场因素,越来越多的企业开始采用混合云作为IT 架构,市场研究机构Gartner、IDC 也力推混合云,因此2017 年被认为是混合云发展元年,在这之前公有云和私有云并行在各自领域平行发展。由于公有云的面向开放的市场特点,其近十年得到了长足的发展,至今仍在快速发展中。虽然私有云规模依然很庞大,但相对来说,其发展要慢得多,无论是在产品丰富程度上还是在性价比上,公有云都远胜于私有云,这也是之前公有云领导者AWS 无视私有云的存在、不看好私有云的原因。此外,在公有云发展早期,也有一种观点:看好私有云,不看好公有云,觉得私有云是未来。这种观点一度很盛行。但近几年这两派观点都从对方身上发现了优点:从私有云角度,公有云代表了产品丰富、快速迭代、*开放的市场;从公有云角度,私有云在满足数据安全、法律合规方面短时间无法被取代。这就是混合云目前面临的机会。

2. 云计算出现的原因

云计算的出现有市场和技术两方面的原因,先看看市场原因。

云计算正是产生于“后摩尔定律”时代,在这一时代,由于工艺制程的限制,CPU 集成度越来越难提高,同时单纯通过提高CPU 集成度并不能大幅提升性能,而社会每年产生的数据量以远超摩尔定律的速度扩张,对计算性能的需求越来越大。根据1.2.2 节提到的有关性能的定律,只有计算集中才能提升性能,同时距离是计算的敌人。此外,Grid 模式的超算中心进行的也是集中计算,但由于技术架构的原因,其要求有统一的可靠硬件,成本比较高、难扩展,所以建立以普通PC 为主的超大数据中心来满足全社会的计算需求就顺理成章了。

云计算在很大程度上是一种生意模式。很多互联网公司需要一种所谓的轻资产模式,即:这些公司有很多计算业务,但不愿自建数据中心,因为数据中心是重资产,需要比较大的投入,以及进行后期维护,而且随着时间的流逝,数据中心这样的资产减值很快,这个痛点刚好就是云计算的生意本身,它让这些企业无须对物理资产进行投入,也无须在硬件上投入人员运维,并且还可以避免硬件资产随着时间而快速减值。

除了市场原因,云计算的出现和存在还有很多技术原因。一种产品的出现和流行一定会等到相关技术相对成熟后,云计算也不例外。云计算的出现和存在主要得益于如下关键技术的成熟:

    • 虚拟化技术。
    • 分布式存储技术,如GFS、Ceph。
    • 基于 x86平台的 SDN交换机。
    • Linux Server。
    • KV数据库。

可以这么说,没有这些关键技术云计算就不可能存在。值得注意的是,很多核心技术并不是产生于云技术,而是在云技术出现之前就已经相当成熟了。正是在这些条件的催化下,2006 年AWS 首先开启了基于虚拟化技术的云计算商业服务。

总结:云计算是为了解决巨大的计算需求,而建立在众多关键成熟技术上的一门互联网生意。

3. 云计算短期发展趋势

在讨论云计算的短期发展趋势之前,我们看看一个产品是如何被市场接受并流行起来的。

在正常市场机制作用下,功能、性能、价格这三个因素会对一个产品的销售起到决定性作用。其中功能和性能因素代表该产品的实用性,价格则决定了该产品的流行性。当然,市场机制比较复杂,还有各种因素参杂其中,比如行销策略、商业同盟、生态建设、公司策略、新技术的出现等,都有可能影响这个产品的发展趋势。

这里只讨论对消费者有直接影响的主要因素,即功能,性能和价格,只有这三个因素一起达到临界点时,这个产品才会得到大规模普及。同时,如果这个产品能以符合市场预期的速度迭代来提升功能和性能,那么它就会有非常好的流行趋势。

回到云计算上来,现在云计算正处在一个市场接受程度比较高的时期,大到国家,小到个人,都意识到云计算的重要性,目前其功能、性能已经能满足市场需求,价格也在逐年降低。总体来看,云计算短期发展趋势包括如下几个方面。

    • 垂直化:在各垂直领域,由于其个性性要求,公有云会对其进行部分定制,比如金融云、政务云等对安全要求更高,云厂商会在物理层面进行更高级的安全定制。
    • 混合云:随着公有云和私有云在两个平行领域发展十多年后,公有云无论在产品丰富程度上还是价格上都碾压私有云,但在数据安全和法律合规方面,私有云短时间内还无法被取代,所以目前阶段公有云和私有云混合就成了必然的流行趋势。
    • 微服务 :虽然 IaaS 长期占有较大的云计算服务比例,但近年来,随着基于Kubernetes 的微服务模式的流行与成熟,很多用户的应用服务会慢慢迁移到Kubernetes 平台。
    • IoT:随着 5G 慢慢成熟,将会有越来越多的智能设备连接到云端,针对物联网的云平台将得到蓬勃发展。
    • AI :基于 AI 的智能云会以服务方式渗透到各种应用中。
    • 生态化:IaaS、PaaS 基本已经发展成熟,特别是云原生的流行,将会有越来越多的开发者选择云平台进行开发、部署,同时围绕云原生软件厂商,用户会逐渐形成良好生态。

4. 云计算长期发展趋势

未来5~10年,我们认为云计算有如下发展趋势。

    • 云计算依然存在,并且会得到进一步增强。原因依然是冯·诺依曼体系结构难以突破,这意味着当数据越来越多时,所要求的算力会越来越大,这样计算就会越来越中心化,同时数据也会向计算中心靠拢,这种力量就如同引力作用。这种趋势会在两个时间点发生变化:

- 互联网速度大幅提高到数据迁移成本(时间和金钱)可以忽略。

- 计算和存储成本大幅下降。

    • 能提高算力的新技术会先在云端爆发。计算集群的扩张会给技术、成本、管理甚至能耗带来巨大挑战,同时也加快了云软硬件的快速迭代,凡是能提高算力的技术都会先应用到云端,因为只有云端的用户群是最广泛、最全面的。未来如量子计算、5G应用等也会先在云端出现。
    • 低价格让云计算普及到生活各个方面,真正成为社会基础设施。云发展仍处在上升期,有遵从摩尔定律的态势,这意味着单位算力的价格会逐年下降,从而吸引原来不在云上的服务,让云逐渐渗透到各个邻域,包括个人。
    • 云部署架构从集中化趋向于分布式发展。目前云部署架构集中在一些被称为“地域”的物理地点,各个地域都是独立的计算单元,彼此在技术上没有关联。由于网络的加速,未来各个地域在技术上的联系会加强。另外,各种用途的边缘计算的节点能力也会大大增强,这些节点会组成一个分布式云架构。



上一篇:阿里云数字新基建系列——混合云架构(第2章-3)


下一篇:Flutter技术解析与实战——闲鱼技术演进与创新-第1章(5)