科技雷达|云原生:企业数字化创新的最短路径

Cloud-native: The Shortest Route to Digitalization and Innovation
本文全面回顾了阿里巴巴十五年云原生实践历程,并重点解读了在数字经济的背景下, 企业如何通过云原生实现应用云化,充分发挥云的价值,快速激活数字创新能力。

今天,数字化成为企业的核心竞争力,千行百业都在拥 抱云计算、拥抱云原生。2020 年是云原生落地的元年, 2021 年将是云原生加速推动企业数字创新的关键节点。

阿里巴巴十五年云原生实践

阿里巴巴拥有十五年的云原生实践经验,在这过程中,我们 经常会面临一些关键决策点,在这些决策点上的每一步选择, 都对阿里巴巴的技术创新进程产生重要影响。阿里巴巴为什 么全面拥抱云原生,每一步决策背后是如何思考的?

2006 年,我们开始探索互联网分布式架构,这是阿里巴 巴云原生的一个起点。为什么要做互联网分布式架构?当 时淘宝在快速发展过程中遇到了技术支撑瓶颈和技术迭代 效率瓶颈。传统“IOE”架构的可扩展性不足,无法支撑 海量 C 端用户访问;300 人开发 3 个系统,带来巨型应用 代码合并冲突、多项目环境并存、发布变更冲突等,进而 导致研发效率低下,业务推进不够敏捷。因为这些痛点我们提出要做服务化拆分、去“IOE”,研发 互联网分布式架构。2008 年淘宝的整个服务 拆分已经完成,形成了三大核心中间件,并对 行业进行了开源 (Dubbo、RocketMQ 等 )。

2011 年,我们开始推进容器化落地,那时全 球做容器化改造的公司屈指可数。原因是随着 业务规模的高速增长,技术成本问题开始凸显, 我们开始重点优化资源利用率。从资源供应的 角度存在几种形态,比如用纯粹的物理机,这 就意味着切分粒度比较粗,CPU 利用率不高, 如果用虚拟化技术进行隔离,在内网可信环境 中会产生一定的资源损耗和性能消耗。2011 年阿里巴巴开始做容器化技术改造——T4 项 目。容器解决三个核心问题,一是提高部署密度, 二是实现标准化运维,三是轻量级资源隔离。 随着 Docker 的出现,容器镜像的标准化能力 对自动运维产生了更强的推动,使得应用可以 实现标准化交付。基于此,阿里巴巴将 T4 和 Docker 集成,推进更标准化的云原生技术。

2015 年,当阿里巴巴的云原生产品技术锤炼 成熟后,就开始推进全面商业化,阿里云推出 EDAS、ACK 等核心产品。在这段时期,阿 里巴巴自身的业务发展也开始全面享受云计算 的红利。比如“双 11”、“双 12”这样的流 量峰值型业务,通过云平台去享受资源池化后 的弹性能力。从 2015 年开始,阿里云开始全 面支持“双 11”电商业务。与此同时,阿里巴 巴开始落地基于容器的统一调度以及统一资源 池,并通过混合部署、分时复用、极致弹性等 技术,实现技术栈的统一、数据的统一,用四年时间让“双 11”的万笔交易资源成本下降了 80%,大幅降低 了技术成本,更好地推进了业务的创新发展。

2019 年,对于阿里巴巴而言意义重大。2019 年阿里云支撑了 阿里巴巴“双 11”核心系统 100% 上云,在线业务容器规模 200 万、100% 采用神龙弹性裸金属服务器、计算性价比提升 20%。在 2020 年,阿里云完成了核心系统全面云原生化,云 原生产品开始全面支撑阿里巴巴业务,成为全球最大规模的云原 生实践。这背后的原动力,就是利用云原生的平台、产品、工具, 实现应用和业务“云上生、云上长”,大幅提升资源效率、运维 效率和研发效率。阿里巴巴全面云原生化,就是认准了云原生技 术趋势的未来,利用云原生快速降低技术成本、提升技术效能。 设想一下,如果一家公司有 1 万名工程师,提升 10% 的研发效 率,就能节省 1000 名工程师的人力,1000 名工程师意味着一 个可研发中型产品的团队,这将释放出巨大的生产力,带来更多 的商业创新机会。

在云原生时代,云产品的立身之本就是开放标准、快速迭代, 持续具备技术领先优势,持续做先进生产力的代表,赋能客户 的业务创新。目前,阿里云拥有国内最丰富的云原生产品家族, 有超过 300 款的云产品,包括云原生 DevOps、aPaaS& 微 服务、消息和事件驱动、可观测 & 高可用、Serverless 架构, 以及云原生数据库、云原生大数据与 AI、云原生安全能力等。

云原生的价值就在于让更多的开发者和企业可以快速利用云的 能力,比如弹性、分布式算力、软硬一体化加速和全 API 服务化, 无需关心底层基础设施,将精力都聚焦在应用层和业务创新上。 云原生技术一定是兼容开放标准、无门槛的,云原生开源让云 计算变得更加标准化。面向开发者社区,我们持续构建开源生 态,把云计算的研发成果回馈给全球顶尖基金会,更好地促进 整个技术生态的发展。我们建设了大量的开源项目,构建开放 标准的技术体系,让更多的开发者使用更先进的云原生技术。今天,阿里巴巴的开源项目总数已经超过 2600 个,涵盖了操作系 统、大数据、数据库、AI、中间件、容器、Serverless、前端 等领域。其中的一些开源项目也成为了该领域的事实标准。比如 Dubbo 已经成为国内影响力最大、使用最广泛的开源微服务框 架;RocketMQ 是国内首个互联网中间件的 Apache *项目, 也是常年霸榜国内前三的开源中间件项目。此外,我们还推出了 应用管理引擎 KubeVela、边缘计算项目 OpenYurt,以及首个 Serverless 开发者平台 Serverless Devs,它也是业内首个支 持主流 Serverless 服务 / 框架的云原生全生命周期管理平台。

随着云原生的发展,云计算的使用界面在逐渐上移, Serverless 带来全托管、免运维,极致弹性、快速上线等 特性,让研发人员可以将更多精力投入到业务逻辑中。今 天,Serverless 逐渐成为云计算的主流技术。3 月 25 日, 权威咨询机构 Forrester 发布 2021 年第一季度 FaaS 平台 (Function-As-A-Service Platforms) 评 估 报 告, 阿 里 云 函数计算凭借产品能力全球第一的优势脱颖而出,在八个评测 维度中拿到最高分。阿里云比肩亚马逊成为全球 FaaS 领导者, 这也是首次有国内科技公司进入 FaaS 领导者象限。

阿里云对云原生的三个断言

Gartner 报告曾指出,到 2022 年,将有 75% 的全球化企业将 在生产中使用云原生的容器化应用。在企业上云的趋势下,我们 正在看到越来越多的企业和开发者把业务与技术向云原生演进。

云原生是云计算的再升级,阿里云对云原生提出了三个断言:

第一,对于云平台而言,云原生将成为云计算的新界面。容 器彻底改变了云的使用方式,它创造了新的架构可能性。容 器化是走向云原生的关键,如果说云原生是一栋大厦,那么 容器化便是这座大厦的地基。容器向上支撑多种应用工作负 载和分布式架构,向下封装基础设施,屏蔽底层架构和异构 环境的差异性,并形成应用打包、镜像分发、交付的标准。 阿里云容器服务 ACK 向下封装了 30 款云产品,对于整个 云平台的交互使用、弹性交付形成了一个新的界面,从而提 升了业务应用的弹性、自动化和韧性。除了弹性释放容器也 向下推动了软硬一体化加速,典型就是“神龙裸金属服务器 +ACK 容器服务”的最佳组合。

第二,对于开发者而言,云原生正在重塑整个软件生命周期。
我们看到云原生向下延伸推动软硬一体化,向上延伸推动架构 现代化,水平延伸解决研发运维全生命周期的挑战,包括代码 开发、应用框架、DevOps、CICD 流程、运维变更、可观测等。 云原生与开发者的整个开发流程息息相关,每位想不断提升自 身价值和生产力的开发者,都可以找到最完整丰富的云原生工 具和技术产品。

第三,对于企业而言,云原生是企业数字创新的最短路径。云 原生对于企业技术演进的价值在于,它可以助力实现基础设施 云化、核心技术互联网化、应用架构现代化、业务数据化智能化。 这些特性给企业带来最直观的业务价值就是资源弹性、系统稳定、应用敏捷、业务智能、可信安全。生长于云原生时代的企业, 可以完全把自己的 IT 体系基于云去构建。

数字化创新中的云原生实践

企业数字化创新需要经过三个步骤:IT 基础设施云化,提升 IT 资源利用率、运维效率和用户体验,只有基础设施云化了, 才能让传统 IT 架构变成随需应变的数字化基础设施,才能够 满足前端不断变化的业务需求;核心技术互联网化和架构现代 化,传统 IT 架构实现服务化重构升级,构建低耦合和强韧性 的系统,提升技术可扩展和业务敏捷性,打破数据孤岛,构建 双中台,用数据驱动业务,促进业务的创新发展;应用数据化、 智能化,当管理端、生产端、消费端所有业务打通形成数据化 沉淀后,企业就进入到应用场景的智能化阶段,需要驱动一切 数据的业务化。通过 IoT 技术将物物连接,生产更多的数据, 通过机器学习、人工智能等大数据技术手段,深入挖掘数据的 价值,拓展认知边界,解决过去无法解决的业务洞察和业务创 新问题,找到解决业务问题的数字化钥匙。

数字化转型 或许没有统一路径,但经实践检验,云原生是企业实现数字创 新的最短路径,企业沿着“IT 基础设施云化、核心技术互联网化 & 架构现代化、应用数据化智能化”三个步骤,通过因云而 生的云原生,将实现真正的数字化创新落地。

上一篇:Flink 执行引擎:流批一体的融合之路


下一篇:Guava 是个风火轮之基础工具(2)