前些日子,我还在西溪园区上班的时候,如果不是忙得不可开交,我都会在午饭的时候尽可能选择一个离所在办公楼远一些的食堂吃饭。因为午餐和晚餐是一天的工作中难得的两个「放风」时间,如果碰到了有趣的话题还能在路上和同事交流一二。
有一次,同事问了我一个问题:「为什么 Spring Boot 应用倾向于打 fat jar 直接启动,而集团的应用倾向于打 war 包从应用容器启动?」当时我从 IT 主流思潮的角度给了一个解释,大意为 Spring Boot 是 DevOps 时代的产物,集团大多数应用是 Dev 和 Ops 分离时代的产物。
这种说法抽象程度略高,虽然也能做为一种解释,但是没能很好地把事情表达完整。于是我把当时的解释整理完善后,写下了现在这篇博文。
Java 应用部署于应用容器中,其实是受到 J2EE 的影响,也算是 Java Web 有别于其他 Web 快速开发语言的一大特色。通常我们在交付 Java Web 应用的时候,交付件是一个后缀为 war 的内部目录结构符合一定规则的 zip 压缩包,这个压缩包里(几乎)完整打包了 Web 页面(模板)、Web 站点描述、Java Web 的各个模块的 jar 以及依赖的第三方 jar。运维将这个 war 文件部署到应用容器中,站点就能被访问了。
在虚拟机在数据中心里开始流行以前,Java 应用是直接部署在物理机上的。但是单一的 Java Web 又很难将一个物理主机的全部资源有效利用,为了节省成本,我们通常会将多个 Java Web 同时部署在一台物理机上,确切的说,是将多个 war 文件部署在一个应用容器里。
在一个应用容器中部署多个 war 文件,就能实现在一个 Java 虚拟机进程中为多个站点提供服务,这能有效地节省内存资源,特别是在那个内存比较金贵的年代,这种特性意义重大,甚至应用容器还能动态地部署和卸载 war 文件而无需重启 Java 虚拟机。
刚才我们说 war 文件是一个 zip 压缩包,其实我们更常见的做法不是部署这个压缩包,而是部署 war 文件解压之后的目录。那是一个运维和开发分离的年代,开发交付 war,运维部署 war(解压之后的目录)。随着公司业务飞速发展,Java Web 承载了巨大的流量,应用容器开始暴露一些寻常难以发现的问题,甚至有时候这些问题会导致线上故障。于是渐渐的,开始有团队专门去维护开源的应用容器,修复漏洞,提升性能。
由于研发团队交付的是 war 文件,当应用容器需要更新的时候,运维团队能够在研发团队不需要介入的情况下完成 Java Web 的重新部署。甚至当一些常用的底层框架出现了安全漏洞的时候,运维团队也能扫描全部机器全部 war 解压出来的目录中的 jar,将有问题的依赖替换之后重启应用完成修复。
随着硬件性能逐步提升,也随着虚拟机技术被数据中心广泛使用,之前一个物理机上混合部署的十几个 Java Web,摇身一变成了一个物理机上虚拟出来的十几个虚拟机,每个虚拟机里部署一个应用容器和一个 Java Web。
虚拟机技术的广泛使用,给应用运维带来了极大的便利,再也不用担心机器环境被破坏,再也不用担心应用之间依赖冲突,只需要几行命令几个脚本,一个配置完善的开箱即用的 Linux Server 就唾手可得。再也不用纠结哪些应用可以混合部署哪些应用需要独立部署,流量低峰期就超卖来压缩成本,流量高峰到来之前再将虚拟机飘到空闲主机上避免资源争抢。
后来开发杀入运维领域,诞生了一种新的工种,DevOps。当开发和运维都是一个团队甚至一个人的时候,将应用和应用容器分开来部署,就显得十分繁琐了。因为无论是升级容器还是升级应用,对于 DevOps 来说,都是一次没什么明显差别的升级任务,最好能用一套统一的部署流程去完成。也许 embedded servlet containers 就是在这种需求背景下诞生的,应用容器不再是独立于应用之外的容器,而是作为应用的一部分,伴随应用一起部署和升级。
Spring Boot 就诞生在 DevOps 盛行的这几年。借助 embedded servlet containers,使用 Spring Boot 开发的应用将一个 Jetty 或者 Tomcat 嵌入在它的交付件中,整个 Java Web 应用连同应用容器打包成一个 fat jar,只需要一行 java -jar webapp.jar
就能完成应用的启动,我们甚至都感知不到应用容器的存在,仿佛只是在运行一个普通的 Java Application。于是升级容器的工作,就和升级一个第三方类库一样,修改 pom 文件,打包,发布,轻而易举。
再后来,伴随着以 Docker 为首的一众容器技术的兴起,我们正在渐渐进入 Immutable Infrastructure 的时代。
不可变基础设施,是 Chad Fowler 于 2013 年提出的一个很有前瞻性的构想:在这种模式中,任何基础设施的实例(包括服务器、容器等各种软硬件)一旦创建之后便成为一种只读状态,不可对其进行任何更改。如果需要修改或升级某些实例,唯一的方式就是创建一批新的实例以替换。
在容器时代到来之前,虽然我们已经在 Spring Boot 之类的框架的引导下,将 Java 应用打成了一个 fat jar 来分发和部署,但实际上我们分发到生产环境中的内容,远不止这个 fat jar。为了让应用代码能够在不同环境中部署,我们会将各个环境不一致的内容抽取出来,保存在配置文件* Java Web 应用启动时读取,比如数据库连接串、密码,比如 ZooKeeper 集群的 IP 列表。为了能够动态调节日志等级和格式,我们还会单独为 logback 等日志器提供配置文件,还要监听这个日志配置的变化。
这些 fat jar 之外的配置,给应用的部署、扩容带来了外的负担。容器想要为我们处理这一切。如果我们将配置文件打包进容器镜像中,我们就能得到一个随时可以部署的镜像,应用的部署和扩容变得简单起来。但是包含配置的镜像完全没有对环境变化的适应能力,在集群 A 上跑的好好的镜像,也许就没法部署在集群 B 里头。于是我们开始使用环境变量去描述各个环境不一致的内容,在启动 Java Web 之前先用环境变量渲染出一份适合当前环境的配置。于是,我们又得使用一个配置管理数据库来管理这许多环境中的许多环境变量,用一个中心化的 CMDB 去取代之前散落在各个集群的应用配置。
Java Web 应用部署的方式,从最初的应用容器 + 物理机 + 多应用混合部署,到应用容器 + 虚拟机 + 独立部署,再到 fat jar + 虚拟机,最后是如今的 fat jar + Linux 容器,伴随着业界运维自动化智能化的浪潮一路走来,也让我们看到了工程师从「术业有专攻」向 DevOps 乃至全栈工程师转变的趋势。通过提供随时随地轻松获取的 API 化的计算资源,云计算正在加速这一转变,云计算也让正处在转变过程中的工程师的工作越来越轻松有趣。
创业去做云计算并没有比之前任何一个时代轻松,真正变得容易的是基于云计算的创业
很幸运身处这样一个时代,能够参与到云的建设之中,为了无法计算的价值。据可靠消息,阿里云 ApsaraDB 管控团队近期正在招聘,加入团队就有机会在云计算环境下管理和自动化运维海量服务器,了解多机房容灾的原理,深度了解 MySQL、SQL Server、PostgreSQL、Redis 和 MongoDB 等各种数据库的原理和实战应用。我们希望你和我们一样,具备如下能力:
- 掌握扎实的 Java/Python 基础,熟悉集合类,I/O 及多线程/协程编程,理解各种容器类的内部实现
- 三年以上 Java 进行 Web,API 或中间件的全流程开发经验,熟悉 Spring,iBatis,缓存,连接池等常见基础框架的使用、原理和实现
- 熟悉常用设计模式,熟悉基本 JVM 原理、参数及问题排查,掌握 JVM 性能调优的常见方法及故障排查方法
- 熟练掌握 SQL 和 MySQL,对 SQL 优化有一定经验,掌握事务的基本原理及实现
- 熟练掌握 Linux 下常用的 shell 命令,掌握 Linux 基础性能指标及线上问题排查与解决方法
- 对分布式系统及分布式存储理论,如 CAP,一致性哈希,MVCC 等原理及算法有一定了解
- 熟悉日常开发流程,熟悉常用开发、调试工具、代码管理工具,如 Git、Maven、Eclipse 等
- 思路清晰,良好的沟通能力与技术学习能力
- 有线上大规模分布式系统开发、部署或运维经验者优先
- 有 Python、Perl 等其它脚本语言开发经验者优先
如果你愿意和我们一起打造最优秀的云数据库平台,请不要吝啬你的简历,发送邮件至 xile@alibaba-inc.com 尽情勾搭吧!