以下内容根据访谈视频整理而成
在2017年,阿里云不仅完成了ECS企业级产品的发布,而且完成了一次软件和硬件的数据迭代,推出了新一代硬件架构和软件架构产品,同时还持续优化和挖掘现有功能和产品形态优势,把弹性发挥到极致,在弹性上做了进一步功能优化和深度挖掘。
今年阿里云ECS升级带来了哪些方面的提升?
在企业线发布之前,很多企业客户也在使用阿里云ECS产品,体验也还良好。作为产品方,我们很清楚企业在某种特定场景下用当时的产品是否能达到最优的性价比。答案肯定是否定的。所以针对企业的复杂场景,如数据库、大数据、针对性AI运算等,我们有很多新定义的产品,保证在特定场景下,客户能选择最优性价比的产品。这也是阿里云发布企业线的根本目的。
如何做到企业级产品在性能和价格上的优化及场景化方式推荐?
在企业级产品的定义里,我们对各种软硬件体系架构进行了深度优化。每个企业级场景对性能有不一样的要求。做数据库的用户比较在意磁盘I/O能力的稳定可靠;做大数据的用户在意的是整个计算机通路的稳定性和可靠性。不同场景有不同的性能偏好属性。基于这点,通过软件和硬件的优化和迭代,我们选择了最合适的硬件和最合适的体系架构,保证在特定场景下,给客户提供的产品性价比是最优的。综合来看,在软硬件体系结构上,我们结合了年中发布的基于新的计算存储分离的存储分离架构的Apasara vSwitch第二代新的交换机架构,和依赖底层的新发布的Skylake新一代阿里巴巴定制处理器,以及底层最强I2数据网络。综合整体体系结构全方位提升能力来定义企业级产品线,保证在最新软件和硬件技术下,整个企业线的极限性能和性价比都是最忧的。
弹性具体体现在产品的那些方面?
简单来说,弹性是整个弹性计算产品中一个最大的亮点。弹性计算的弹性体现在两个方面,一是资源唾手可得、二是按量付费。用户无论什么时候想要计算资源都能拿到,时间上是很弹性的。同时,由于完全根据使用量来计费的,所以付费方式也是很弹性的。
对于用户来说,弹性体现在哪些价值上?
弹性在阿里云云计算已有结构上用的已经非常成熟了。比如客户在准备大促活动的时候,传统方式是提前花费很长时间做预算、采购服务器、上架、准备环境。然后还得保证业务量不会突破事前预估的最大量级。这在整个运营中,由于很难估计真正的运营效果量级,所以效率低,而且成本和后期运营风险也很大。在云上,客户可以在任何地点,任何时间点提出资源使用需求,还可以通过弹性API做到在分钟级创建成百上千的机器。在用户业务的弹性和业务的支撑能力上,这是一个非常大的提升。在付费方式上,传统服务器在客户购买服务器后,只要上架,无论客户是否用的上,成本每天都在叠加。在云上,客户可以按实际使用时间计算付费。所以对客户来说,无论在业务承载能力上还是在成本构成上都是极大的提升和优化。
2017年我们有哪些具体弹性服务提升的点?
弹性确实是阿里云ECS一直强调的,也是一直在深挖的点。我们做了哪几件事呢?可以划分成三大重点:一是我们推出了行业内独创的包周使用方式。过去客户只有按量付费和包年包月两种选择形态。今年推出的包周相比包年包月来说是一个更短时间的选择;二是我们推出了新的竞价型实例的购买模式,这种模式能给客户带来更好的弹性和更均衡的价格的选择;三是我们推出了按量付费、按秒计费的技术。按秒计费使计费更加精准,客户的花销可以精准到秒的级别,进一步减轻客户资本压力。
按周付费相对原有的包年包月付费形态有哪些优势?
现在大家在ECS的购买页面上能够看到有包周的时间选择形态,这个形态主要针对用户短时间使用时的场景。在过去,用户如果选择按量付费运营一周或者两周的时间,整体来说成本是较高的。而如果选择购买包月付费方式,使用一周后资源就浪费了。前一个选择使客户的成本产生浪费,后者使计算资源产生浪费,所以我们推出了包周的使用形态。用户在用一周或两周的计算力情况下,不管是对比过去的按量付费还是用包月的方式,包周都可以带来大约50%的成本节约。
近期上线的竞价型实例具有哪些特点呢?
和过去传统支付方式相比,竞价型实例在云计算资源的使用形态和支付方式都有着颠覆性的变化。因为阿里云有很大的资源池和海量用户,所以在大规模资源的运营和运维的能力技术基础上,我们可以把资源进行统筹化管理。统筹化管理带来的好处是对于客户来说可以弹性地使用计算资源。对我们来说,也能充分发挥空闲资源的价值,所以我们推出了竞价型实例这样的形态。竞价型实例可以把价格降低到按量付费的一折起。对于很多的实例类型,通过竞价型实例,客户实际使用的价格可以在一折左右的量级,上限价格是由整体供需关系决定的。也就是说越多用户在同一时间点请求使用竞价型实例,它的价格就会越高。如果客户在低谷期使用竞价型实例,它的价格就会变得很低。所以用户可以通过竞价型实例拿到一个具有非常高性价比的特定计算能力资源。可这种形态非常适用于类似文件渲染这样的离线业务或对时间不敏感的业务。
新产品神龙云服务器的特点是什么?
从产品形态来看,神龙云服务器具有和物理机一样的计算能力,没有任何虚拟化的损失。在维持高计算力的同时,它也和弹性的产品需求结合,保证了产品能够做到分钟级别交付、秒级别精准付费。我们通过在整体软硬件结构上深度定制化以及强大的资源技术做到了这点。客户为什么会比较敏感呢?因为目前在拥有物理机级别计算能力的产品形态的基础上,整个行业内没有人能够做到既提供物理机计算力水平又做到分钟级别交付、秒钟级别计费,但阿里云神龙服务器做到了。神龙云服务器也是企业级客户非常适用的高端级产品。客户可以拿到一个非常完整的与物理机同等水平的计算力又能拿到传统云服务器才有的弹性能力,因此是一个非常好的整合。可以说神龙云服务器是集合了物理机和阿里云传统云服务器的特点和优势的一款产品。
新产品企业线实例T5具备哪些优势?
T5是今年年中的时候发布的企业线实例之一。在企业线发布之前,阿里云很多产品都是针对一些入门级场景使用的:共享型实例、入门级实例。过去的共享型实例没有清晰定义它具备的性能极限是怎样的,客户在选择入门级实例的时候对其性能期望是无法量化的。比如用户期望用一台实例承担计算业务。当业务高峰期来临,因为共享资源,计算力可能衰减导致这台实例承载不了他期望的计算力。我们在定义T5突发性能实例的时候,着重对这方面进行了优化。T5系列的每一款实例类型都具备非常清晰的性能极限,这个极限的含义就是用户可以期望实例在这个计算力水平上稳定运行。同时,因为自身业务峰值和谷值原因,能够把计算力节省下来提供给突发峰时候利用。这对客户来说有了非常精细的计算力规划。不管是在数量上还是在单时的性能上,客户都可以非常有针对性的进行选择。相对于之前几代的实例,在成本上也有很大的降低。单实例的降价范围能达到百分之十到百分之四十的区间范围。
在产品的稳定性和安全性方面,ECS今年有哪些重大的突破?
稳定性和安全性是从ECS上线之初阿里云就一直强调的两点。因为我们主打将客户业务搭建在阿里云上,所以稳定性和安全性是ECS产品最基本的前提。我们今年在维持高稳定性和高数据安全性的前提保障基础上,保证将数据可靠性做到九个九的量级。这在行业内也达到了*的水平。同时在服务可靠性方面,我们做到了三个九、一个五的高水平。
ECS产品在技术上如何做到九个九和三个九、一个五的指标?
这个技术涉及范围很广,我们可以从客户不太关注的方面来聊一聊。稳定性和可靠性需要软硬件体系架构全体系的优化提升。取个底层的例子:在IDC的选择方面。阿里云所有IDC选的都是行业内最*的IDC。这可以带给我们怎样的能力呢?比如每个机房都要求具备双独立的市电供给,也就是说每个电源都必须来自两个独立的供电站。任何一个供电站出现故障都不会影响机房电力的稳定供给。在此基础上我们还提供了具备一段时间持续供电能力的电池和柴油发电机,保证在突发事件导致双电路断电情况下,机房依然可以通过电池短时间供电,再换上柴油发电机供电使机房稳定运行。另外一个客户不太关心的点是ECS所有选择的IDC的机房在网络上都做到了3+A网络接入,保证客户的终端使用时,网络延迟是最小的,比如小于40ms的网络访问延时。再有一点,在保证网络的稳定性上保证每个IDC光纤接入的冗余度。保证单一光纤突发故障时,网络数据的稳定性传输。这就是我们在底层做到的两点。同时,在多程序之间、在软件架构上,所有网络体系里所有的节点连接都不是单节点相连的,保证任意单节点的失效不会影响到业务的稳定性。以上都是我们前面提到的N个9的技术支撑。
对于一些中小企业或者个人用户怎样能快速上手ECS产品?
前面提到的那些点大家可以不需要太过纠结。客户只要知道我们的服务是非常稳定可靠的就够了。阿里云ECS产品是一种服务级形态产品,最终达到的是交付服务的状态。在过去,作为一个IDC的租用者,你需要关注比如刚刚提到的电力的能力、网络的能力等这些保证最终服务交付能力的每一个点。现在,这些能力在阿里云上只是最基本的能力原子单位。阿里云最终保证的是交付给客户的服务可用性,客户只需要关注服务可用性就,不需要过多了解底层技术。换一个角度来看,由于人力投入和资源投入的有限性,小客户在传统租IDC的时候,跟大客户、大型IDC租用者相对比,业务稳定性和弹性能力是有很大的差别的。这种差别在云上面完全被阿里云抹平化了。即使是个非常小的用户,在云上也可以拿到跟跨国企业、巨头公司相同的计算稳定度和服务等级的资源,这也是一个非常大的颠覆。
应该如何挑选ECS产品使业务实际需求得到满足?在离线业务和在线业务这两种场景下客户应该如何选择比较好?
区分客户业务最基本的判断就是客户业务是在线业务还是离线业务。在线业务是非常典型的。双十11对电商类客户是一个重大的节日,在做双11大促活动的时候,客户一定会在云上或线下IDC搭建业务,包括购物类等所有环节的应用服务器。这种服务器在云上提供了几种机型选择。客户如果在选择机型的时候没有一个清晰的认知,在做在线业务搭建的时候,我推荐在云上选择通用型服务器。这种服务器的场景定义范围非常广泛,计算能力、存储能力、网络能力非常均衡。客户不清楚自己要什么的时候先选它基本不会错,使用过程中,如果发现某一方面能力遇到瓶颈,客户可以将实例变配升级到其他的实例类型,这对在线业务是一个非常好的选择。
针对数据库场景是不是选用通用型实例比较好呢?
数据库场景有些不一样。在刚推出企业线的时候,提供给客户的数据库选择几乎就是通用型实例和大内存实例搭配SSD云盘两种方案。现在企业级实例已经非常丰富,所以可以推荐给客户一个更好的选择。对于中低端性能需求的用户,用通用型实例搭配SSD云盘性价比和数据的可靠性都很高。对于高端性能需求用户,比如巨头型客户,它期望在云上有非常高的性能。客户的核心数据库对磁盘的I/O性能需要百万级别的iops指标。这种场景下用云盘会有瓶颈点。我们推荐使用I系列,也叫本地SSD型实例,I1 和I2是最新的两代实例,i2提供的单实例能力上限可达210万iops能力。这和云盘数据库实例有一定的差别。云盘数据库实例客户不需要担心数据可靠性。因为阿里云对云盘做了三副本,保证数据不会丢失。在I系列产品为了一个非常高的性能,它在底层数据副本上面我们没有做三副本,用户需要在应用层关注数据可靠性的问题。这对于大客户来说并不是问题,他可以用数据库的同步来解决这个数据冗余的问题。
离线的业务场景有哪些合适的产品可供选择?
离线的业务非常多。从客户的各种场景来看,企业渲染就是很典型的一种。现在大数据是大家都关注的一个点。大数据在收集海量数据,分析客户的行为分析等方面各个企业都有使用。在这种大数据场景下,在企业级发布之前,我们提供了云盘和通用型实例的搭配来运行一些大数据场景。现在,我们推出一款大数据机型。我们分析发现客户基于云盘搭建大数据场景时,产生了非常大的浪费和性能的瓶颈。因为云盘是三副本,如果在应用层也做数据三副本保护,每个数据就有九个副本,这导致一个很大的存储空间的浪费。因此在保证性能提升的前提下,基于本地的SSD盘产品形态能大幅度降低成本。大数据场景有计算、存储、网络三个通路非常均衡的特点。我们在定义实例时也在底层的网络能力上进行了充分的优化,搭配了vSwitch第二代来保证计算和存储网络都非常均衡。大数据存储存储I/O可以达到40Gb的磁盘吞吐上限,也就是5GB的存储能力。可以理解为用户在计算,存储到网络通路是没有瓶颈的。这对用户来说是一个非常好的场景性价比的体现。
除了大数据场景,阿里云自己也在做AI深度学习探索。针对这样的场景没有一些特殊的选择可以推荐?
今年AI是一个热点话题,阿里云一直很重视它,ECS产品也在AI方面做了很多产品和工作。深度学习里GPU计算卡是不可绕过去的点。我们今年在行业中首先推出了一款,基于PE版计算卡的实例类型——gn5实例。这个实例搭配了pe版计算卡,计算力与之前的机型相比有质变的提升。同时对于AI场景,用户可能最关注线下的训练和在线的推理两个场景。用户可能会将PE版作为线下训练的选择。对于在线推理场景,由于客户需求特点,单卡的计算力不需要特别强,但是成本尽量低于基于P4计算卡。同时,gn5i完成了在深度学习AI场景里训练和推理的完整的整合,提供给客户在不同场景下最忧性价比的产品选择。
结合弹性这一块,用户在实际购买产品的时候应该怎样购买才会更合适呢?
在弹性方面我们提供给客户的选择越来越多,不同的选择在不同的应用场景里有不同的偏向。我们建议客户在建在线业务场景时,使用包年包月的购买方式来解决长时间稳定的需求。对于临时业务峰值,比如双11大促,可以用按量付费的方式购买资源。这样做的好处是价格虽然贵一点,但资源获得性准确,不用担心资源会被释放掉。针对离线业务场景,客户不需要选择按量付费。离线业务对于时间没有很强的敏感性,使用包年包月方式解决长时间需求是可以。通过购买spot方式解决临时需求,搭建大数据运算或离线训练,都可以得到最好的性价比。
针对离线和在线混布的场景我们该如何选择?
离线和在线混布是真正的云用户用的很深透的场景。举个典型的例子,客户白天的业务是在线需求响应业务,晚上在线业务处于低谷期。可以通过云上快速镜像打包和还原能力,把实例快速切换成离线分析处理实例来解除在线所占资源,这个通过在线API可以很快完成在线业务处理实例和大数据纯计算切入节点的切换,用户通过错峰填谷来保证业务进行利用率达到最高水平,同时成本也是最低的。
针对ECS弹性计算,阿里云双11都有哪些优惠?
购买首台所有规格实例的新购用户都能享受到五折的优惠。针对老用户,在续费优惠中,我们推出一年付八折优惠活动。除了有新购五折和续费八折优惠,部分实例会推出六到七折的优惠活动,这些优惠都是不限实例台数,大家可以持续关注双11分会场获取更多阿里云双十一优惠活动信息。
双11第一波,红包领不停,点击看详情:https://promotion.aliyun.com/ntms/act/pre20171111.html