2.1静态 TCO模型
静态 TCO模型反映的是基于某个特定条件下的成本情况,比如在一个5kW 机柜的数据中心,基于 10Gbit/s,1:2收敛的网络架构,满部署服务器下,其总体成本的情况,简单讲分为固定投资 CapEx(CapitalExpenses)及运营成本 OpEx(OperationalExpenses)。CapEx 是指必须提前做投资,然后在一定时间内折旧的支出,如修建一个数据中心或者采购一批服务器,都属于固定支出。而运营成本是指在折旧之外,一个固定时间内运营设施所需要的成本,比如水费、电费、维修费用、人员成本等。因此,静态 TCO可以以一个较为简单的公式展现出来
TCO= ServerCapEx+ ServerOpEx+ NetworkCapEx+ 其他费用(如网络带宽成本等)+ IDC CapEx + IDC OpEx
图 2-2是某数据中心在一定的生命周期内所支付的所有费用按照各个要素的占比分析图,从中可以看出服务器占比一半以上,其次是电费,接下来是网络设备和 其他成本。对于数据中心来说,电费远远超过其他设施(如机电、土建)的占比, 努力提高能效、降低 PUE是实现数据中心成本下降的关键路径,这也是为什么在数据中心行业如此强调 PUE,并且国内外先进公司都致力于优化和降低数据中心 PUE的原因。
2.1.1 数据中心 CapEx
数据中心 CapEx指的是数据中心一次性建设的投入成本,通常会按照至少以10年为周期进行折旧。按照设备和系统类型将其分为土建、电气、空调、柴油发动机机组、市电引入等主要要素。图 2-3是某数据中心基础设施建设过程中各个要素的CapEx占比,从中可以看出市电 + 柴油发动机机组与电气系统设备约占整体投资的一半左右,工程相关费用约占整个CapEx投资的四分之一,其他设施加起来约占整个CapEx投资的剩余四分之一。
根据数据中心 CapEx各项投资的构成及比例,可以得出数据中心一次性建设投资的主要优化方法。
首先对于市电 + 柴油发动机机组,可以考虑采用N+1代替 2N系统,以及其他提高系统利用率的方法,最终实现这部分投资比例的下降。对于电气系统设备和空调系统设备,主要采用降低系统冗余度和降低设备品牌依赖度的方法。面对国内日益增长的工程费和人工费用,采用工厂化和预制化的方法,减少现场工作量,并通过自动化和工业化提高工作效率。
2.1.2 服务器及网络设备 CapEx
从图 2-2显示,服务器的 CapEx在生命周期 TCO中占比最大,其组成包含了服务器整机及其相关配件,通常来讲包含CPU、内存、存储设备、网卡、服务器系统等。在不同的场景下,其成本的各自占比不同,典型服务器的静态TCO构成如图 2-4所示。
图 2-4典型服务器的静态 TCO构成
相比数据中心 10年的折旧周期,服务器的折旧周期通常在 3~5年。在一套数据中心中,网络设备的成本包含交换机、网络布线、光模块等设备分摊的成本。
2.1.3OpEx
运营成本是指在折旧之外,一个固定时间内运营设施所需要的成本,比如水费、电费、维修费用、人员成本等。其中又分为数据中心的OpEx及服务器的 OpEx,其中数据中心的 OpEx包含数据中心的电费(与 PUE强相关)、人工等费用,该费用和运营水平、数据中心设计、规模、地点、气候和地理环境、当地税率等强相关;同样,服务器的 OpEx也可以分为服务器的功耗费用(电费)及其维护成本。其中电费和服务器设计、应用场景、运行环境强相关,维护成本与服务器类型、要求的运维标准强相关。在静态TCO模型中,我们通常把数据中心和服务器的 OpEx归一到单位 W的成本上面,便于计算。
2.1.4 产能 /TCO
静态 TCO实际上是一个成本数据,而对于用户来讲,实际上更关注的是单位成本下其基础设施所承载的业务能力,称为单位成本的产能。产能可以是计算能力,也可以是存储能力,还可以是网络转发能力。比如一个承担搜索业务的集群,其整体静态TCO=A,产生的能力为 10000QPS(QueryPerSecond),则其关注点为单位 QPS的成本 A/10000;又比如一个承载虚拟机服务的集群,其集群 TCO=B,可产生的 4core8GBmem的虚拟机实例的个数为 10000个,那么其单位产能的成本则为B/10000。又比如一个做对象存储的服务器集群,其 TCO为 C,提供的存储空间为100PB,其单位产能成本则为C/100。