“我见过一个银行客户,光做一个前台应用就搭了几千台服务器。它打一个补丁,基本上IT运维人员就挂掉了。”江豫京所说的案例并非个案。实际上,身为浪潮商用机器有限公司产品营销部总经理的他,经常与客户交流,发现越来越多的银行和*客户正在探讨使用Power来进行业务支持。我们知道,以Power处理器为代表的RISC精简指令集处理器代表了Scale-up的高性能、高可靠和高稳定;而以x86处理器则代表了Scale-out的高性价比和高可扩展,今天利用云原生软件技术使其通过分布式技术得以在高性能、高可靠和高稳定方面得到提升,从而在今天云计算IaaS基础设施领域得到了广泛应用。不过,客户的案例是最真实的——很明显,即便公有云如火如荼,Scale-up的RISC架构仍有用武之地。
应用的关键
“我们924、922两颗Power处理器搭建的2路小型机,可以整合50台左右的x86服务器,4路能整合100多台,不仅可以节省几十倍的机房空间,在供电方面也明显会有节省。”江豫京的话令人惊讶。
众所周知,Power处理器横向和x86处理器相比,虽然主频可以达到业界最高的4GHz,但比x86最高的3.xGHz并不是数量级上的区别;即便是Power处理器为了满足高负载应用提供了更大的CPU和CPU之间、CPU和内存之间、CPU和I/O之间更大的带宽,但也只是两倍到几倍的提升,无法跟节省几十倍的机房空间相提并论,因为几十台服务器集群甚至几百上千台服务器集群意味着运维管理的难度会成几何级数增加。“小型机的整合能力在于其自带虚拟化的功能。”江豫京解释说,“实际上,PowerVM是虚拟化技术的鼻祖。Power最高端的小机可以支持一千个分区。在这种情况下,我们就可以让客户将大量的使用率不高的前置应用服务器全部整合在几十台小机上面,从而易于资源的调配,易于运维管理,同时达到更高的使用率。”另一个层面,是Power的安全性。我们知道,银行、电信公司的核心数据库主要用的都是Power服务器,一方面是因为Power服务器保证了CPU和I/O之间最高的带宽,来满足大负载的应用需求;另一方面也是因为Power服务器在底层固件上进行了安全加固,而不会仅仅依赖于操作系统层面的安全性进行防护。“事实上,Power所有部件的维护是需要通过认证的。”浪潮商用机器有限公司副总经理黄家明介绍说,“Power能保持系统一致性,不会被篡改。比如说引导Secure Boot的所有部件都内置有类似‘指纹信息’,如果你换了一个部件或者硬盘,不是在’指纹库’里面,那这个部件就无法引导。”
浪潮商用机器有限公司副总经理黄家明
对于浪潮商用机器(IPS)来说,在Power的基础上进行各种国产化部件的开发,都要考虑到整体系统的一致性。而这,并不是一件容易的事情。
从安腾到Power
浪潮做小型机,历史其实可以追溯到26年前的1993年。“1993年,浪潮董事长孙丕恕带领团队研发出了中国第一台基于10颗处理器的小型机SMP2000。”黄家明回顾说,从那时候起,浪潮的思路一直都是从高往下做,即便没有RISC处理器,用x86处理器也要把它做起来。后来,安腾处理器出现了。而浪潮也成立了高效能服务器和存储技术国家重点实验室。在2010年,浪潮参与开发了32路安腾服务器,突破了异构处理器(安腾CPU和GPU之间,以及安腾架构与SPARC架构和Power架构)间的互联难题,开始拥有了缓存(Cache)一致性的技术。后来,安腾处理器在英特尔技术路线的规划上,确定和至强X86架构融合了,安腾的生命周期开始走向终点。这时候,浪潮仍然希望坚持小型机的技术路线,于是最终在2018年和IBM成立合资公司,继续小型机的开发。应该说,浪潮从安腾到Power,不仅把小型机技术团队保留下来,而且还跃升到了小型机中最顶尖的领域。“在x86上,我们一直拿着英特尔的处理器来做主板,做系统,做BIOS,跑起来也能支持Linux,也能支持Windows,而今从开发的角度也有机会做这样Power。”黄家明解释说,“合资公司浪潮商用机器成立之后,我们去做板卡的设计,固件的开发,以及K1、K-UX和AIX操作系统的制式兼容。这就和x86类似了,不再是一个封闭的系统。”
换句话说,浪潮商用机器的使命不只是做销售,而是覆盖几乎整个产品的生命周期,从开发到销售、服务和方案等,都是浪潮商用机器的目标。为什么要这样?其实还是回到文章开头所说的中国客户的应用实例。
技术融合
“我们有个客户要求把两颗OpenPOWER处理器做到600瓦,这是原来POWER设计方案中没有考虑到的问题,但有意思的是,原来我们在x86上的电源控制和热管理的系统设计方案都能放进去,于是两颗OpenPOWER我们做到了600瓦,达到了客户的要求。”黄家明举例说,“这是一个成功的案例,今天这家客户有2000多台IPS的OpenPOWER服务器,形成一个大数据集群,运行非常良好。”在黄家明看来,x86服务器由于本身是一个成本敏感型的设计,比如在主板的生产和设计上,会在如何在保证稳定性的同时让板层减到最少上做文章,这时候的布线设计会把每一根线都考虑周全、精雕细琢。“实际上,浪潮商用机器做设计的时候,会把原来在x86大规模环境下验证过的设计导入进来,同时放入一些新的工艺,新的材料,然后测试信号一致性、XRP的数据、报告等,经过调优后,会在原有基础上大幅提高信号的质量和性能。”黄家明解释说。在固件的层面优化,浪潮商用机器做得就更多了。黄家明介绍说,比如IBM原来的Call Home功能,主要是为了在机器发生故障时告警,同时把之前自动收集的热值进行分析,发现问题出现的原因和解决办法。今天,Call Home功能是浪潮商用机器自己做的,把收集数据的分析变成可视化,让用户能够更好地自主控制、自主管理机器。据了解,IPS通过本地专业团队负责Power服务器的售后服务,更加贴近用户需求。与此同时,IPS保留了Power在可靠性方面三个维度容错的优秀理念:一是空间冗余,是否有更多的路径来冗余容错,包括内存的隔离和内存数据多副本的故障转移等;二是时间冗余,Power允许进行指令集的重试;三是大量的信息冗余,让机器可以通过校验计算恢复回来。“从产品实现的角度,我们导入K1、安腾的东西会越来越多。IPS通用的商用部件整合了浪潮全球的供应链资源。这样在保证更好的经济性的基础上,还会改善原来客户端的问题和客户的顾虑。”黄家明举例说。比如在K1 Power上,主板设计中原先950最大的特点是它的内存不是标准化的,而现在的950内存,采用了标准DDR的内存条,浪潮商用机器自研设计把和处理器之间接口不一样的地方做成内存板了。据了解,浪潮商用机器K1 Power的研发团队有一百多位核心人员,是目前国内高端服务器研发领域最优秀的团队,覆盖了从主板设计到系统、固件、微码的设计,包括整个的测试验证和工程导入的平台等。“事实上,IPS的体系结构是浪潮自己的结构,也是国际PCT专利合作条约的体系结构。因为上层的应用还是要支持Oracle,支持传统银行的一些应用。”黄家明表示,“因此K-UX的使命是,向上要保持相同的UNIX编程接口和应用API的接口,能够支撑现有的应用;向下,操作系统的使命要去理解硬件体系结构,要做局部化,又要保持一致性的空间,做大量顶层的优化的工作。”值得一提的是,浪潮商用机器是去年才成立的,而今在Non-X86市场上,已经达到65%的市占率,得到了客户的认可。据悉,一方面,浪潮商用机器可以很好地帮助客户去完成基于POWER5、POWER6和POWER7的旧版Power设备的迁移、替换工作;另一方面,除了金融城商行、电信行业客户,K1 Power还吸收了越来越多的*客户,无论是税务、*还是财政的客户;此外,在大数据等新兴业务方面,由于K1 Power的工作负载可以跑到75%以上,也吸引了不少客户。综上所述,我们可以看出今天的IT基础设施市场,并非x86云计算一统天下,在企业核心业务领域,实现国产化的K1 Power高端服务器展现出了良好的市场适应能力和市场前景。这是浪潮商用机器一年多来辛勤劳动的成果,也是市场的选择。