8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。
来自阿里巴巴的资深专家王晶昱(花名:沈询) ,将在本次峰会中为大家带来《阿里技术架构演变,及基于EDAS的敏捷服务开发与架构实践》的分享,下面是议题详情,供大家参考。
议题名称:《阿里技术架构演变,及基于EDAS的敏捷服务开发与架构实践》
议题简介:阿里巴巴是国内互联网业界最早实践SOA理念的公司之一,随着阿里业务的高速发展,技术上的挑战也是一个接着一个。 从一个初创型业务,到一个高速发展型业务,再到一整个生态体系。阿里的技术体系架构经历了无数严酷的考验:去IOE,双11,异地容灾。在这个topic中,让我们一起温故知新,共同畅谈未来,看看我们理想中的下一代分布式应用应该如何构架与编写。
关于分享者:王晶昱(花名:沈询) ,阿里中间件技术部资深专家,进入阿里以后一直从事中间件研发工作,主要负责过阿里分布式数据库(DRDS),阿里分布式消息服务(AliMQ),对阿里的技术体系非常熟悉。目前主要的兴趣点在设计下一代的分布式应用体系架构,希望能够让我们未来编写的分布式系统能够跟单机系统一样方便和快捷。
以下是采访正文:
进入2016年下半年,阿里巴巴即将迎来自己的第8次双十一大促。伴随着多年的双十一大促,阿里生态背后的IT系统也接受一次又一次的洗礼。这些年下来,阿里的中间件技术完成了从1.0到3.0时代的蜕变,并已经完成了将技术变成商业化产品,与业界分享。8月31日,来自阿里中间件的资深技术专家沈询将在线分享《 阿里技术架构演变,及基于EDAS的敏捷服务开发与架构实践 》,基于本议题,将会围绕阿里技术架构的发展变革过程中,阿里巴巴中间件技术所面临的技术挑战和我们的解决之道。
・阿里中间件技术部资深技术专家沈询
・2008年加入淘宝
・现任职于中台事业群-中间件技术部
・DRDS(TDDL)作者,分布式数据库,分布式消息系统负责人
云栖社区:可以简要介绍下阿里中间件的研发初衷和历程吗?
阿里在2003年-2006年的时候是单机的集中式的系统,采用的是IOE架构(IBM、Oracle和EMC)。随着业务的发展,传统构架的弊端逐渐显现:上线慢(高端设备的采购周期长、不能快速扩容),故障多(高并发的情况下系统的稳定性出现了多起严重的故障),成本高。从2007年开始,我们就逐渐发现,外部企业级中间件并不是非常适合我们互联网业务的实际发展需要。当时我们面临的现状是:业务需求爆发式增长、开发人员快速扩张、系统代码量越来越多、系统压力越来越大……技术不能束缚业务的发展,业务不等人,我们必须做出选择(后来我们管这种事儿叫高速公路换*)。当时我们希望能够在一些非重要的业务应用上,使用一些我们自己研发的系统,从而实现更符合我们业务要求的产品。面对着每年翻番的用户量和用户请求,我们不得不开始进行分布式应用体系的探索。当时可真是没什么能够参照的,全都得靠自己去探索,经过了三年多不断摸索,我们彻底地将系统进行了服务化、分布式改造。
云栖社区:目前,阿里的核心中间件发展现状如何?研发接下来努力的方向是什么呢?
随着阿里业务的快速发展,阿里的中间件有幸承载了世界上最有挑战场景,这里有世界最大的电商交易业务场景,团队提供的高可用架构基础设施直面双十一洪峰流量,包括容量规划、准入控制、限流降级、流量调度、弹性伸缩和全链路压测等,体系化支撑阿里巴巴电商链路的稳定运行。为了支撑这些场景,中间件自主研发了包括应用托管容器、分布式调用服务、分布式消息服务、分布式数据服务和大数据计算平台等,掌控着超千亿规模的消息推送和分布式数据库调用,是全球流量最大的中间件集群之一。中间件的目标是能够成为分布式架构的基础设施,建设支撑百万笔交易的分布式架构能力,建设支撑百万台服务器和超万个系统的服务能力。最近这几年,阿里的核心技术体系架构已经非常稳定可靠了。我们又在这些核心中间件的基础上,不断地深入细化运维体系,尽可能地做到自动化、智能化,为集团节省了比较多的设备成本和运维成本。目前,整个阿里集团几乎所有的应用都在使用这些中间件。我想,这也是阿里技术体系的精华所在吧。
云栖社区:我们了解到,您分享的议题中的EDAS所提供的分布式服务框架源自于阿里内部的中间件产品,除此之外,目前还有哪些核心中间件产品也转变成云服务了?
在2015年,我们响应了阿里集团上云的梦想,将阿里集团七年的技术积累搬到了云上,目前所提供的主要产品有:企业级分布式应用服务(EDAS)、分布式关系型数据库服务(DRDS)、消息队列(MQ)。它们都是使用Java编写的,为大家量身定做的分布式中间件,与互联网应用体系相结合,能够非常轻松地实现企业IT架构的随需定制和可线性扩缩。另外,前不久北京云栖大会上,刚刚发布了一款可以说是和企业互联网架构平台 Apsara Aliware“三驾马车”(EDAS/DRDS/MQ)并驾齐驱的业务实时监控服务ARMS。互联网的问题要用互联网的架构来解决,如果大家有需求,可以按照自己的需要来进行选择。
云栖社区:中间件迁移到云端,带来最明显的变化是什么?
阿里的中间件在之前的六年里,主要服务于阿里集团内部,而随着云时代的到来,中间件迁移到云端,服务的对象也就必然发生了变化,原来我们的服务对象主要是公司内部的用户,而现在,我们的服务对象扩展到了云上的广大客户。云计算,在给我们提供新机遇的同时,也给我们带来了新的挑战。这其中最为明显的变化,我想应该就是用户对于我们运维体系上的新要求,在此之前,我们主要是一个内部团队,更多地关注在产品的低成本、高性能、稳定可靠等因素,在淘宝高速增长的这些年,我们做得很不错。在历年的双11中,我们的系统几乎从未出现过任何故障,成功的满足了用户对性能和稳定性上面的需要。然而,在云时代,用户不再满足于现有的特性,开始追求简单易用、用户体验良好的产品,这就对我们提出了新的要求,我们需要把我们之前在支持内部用户时所学到的整套运维体系,全部否定掉,然后根据大家的真实需求来重新定义我们的运维模型,说成是一次全新的革命也不为过。
云栖社区:在本次技术峰会上,分享这个议题主要是基于什么考虑?
阿里巴巴是国内互联网业界最早实践SOA理念的公司之一,随着阿里业务的高速发展,技术上的挑战也是一个接着一个。 从一个初创型业务,到一个高速发展型业务,再到一整个生态体系。阿里的技术体系架构经历了无数严酷的考验:去IOE,双11,异地容灾。在这次的topic中,希望能够和开发者们一起温故知新,共同畅谈未来,看看我们理想中的下一代分布式应用应该如何构架与编写。
云栖社区:从08年加入淘宝至今,从应届生一路成长到阿里巴巴的资深技术专家,能否将您的成长经验以及建议分享给开发者们?
兴趣是最好的老师和最持久的能量。刚入行的几年,对我来讲也都是积累期,这个过程相当漫长。也只有不断地去思考,问很多个为什么,逐步地探究事情的本质,才会发现很多事情的本质是相通的,才能”知其然而知其所以然”。一开始,我们只是单纯地关注解决眼前的一个或者一组问题,直到能触类旁通,举一反三,看到一个新的业务、新的技术,就会明晰背后需要考虑的东西是什么,学习新知识的速度会变得非常快。注意观察事情的本质,再做联想和推断,将已掌握的知识迁移到新的领域里去,做一些这样的尝试,可以成长得更快。除此之外,还是要特别注重基础,操作系统、网络、算法数据结构、离散数学、数据库原理与实践,这些看起来枯燥而无味的基础科学,是我目前感到知识最为匮乏,但却最为急需的部分,要了解它们是必须付出非常多的时间才有可能理解通透些。而这些基础的扎实程度,就直接决定了你的高度。这些建议,提供给还有机会实践的各位做参考了。