作者| 阿里文娱高级无线开发专家 付笑冰
在线视频平台为用户提供服务时,面临的一个严重的挑战是,如何保证在为用户提供流畅且稳定播放服务的前提下,尽量降低整体运营成本。
本篇文章将围绕上述问题,重点讨论技术实践中的成本控制手段。
一、视频平台成本的构成
视频平台在提供播放服务的过程中涉及到非常多环节和技术栈,每个环节都会涉及极其复 杂的计费方式,因此分析视频平台成本的构成是量化的第一步。在拆解成本构成之前,我们先以某视频公司为例进行财报分析,其近期的财报如下所示:
从上述财报中可以明显看出,相对于逐年增加的营业收入而言,运营成本及费用的增幅更为显著,最终导致净亏损额的逐年递增。显然,降低运营成本和费用的增速,就等同于降低净 亏损、增大收益。
在对成本进行量化控制之前,首先对运营成本和费用的构成进行分析。某视频公司 2019 年 财报关于成本的明细记录如下图所示:
可以明显看出,除内容成本之外,带宽成本是占比最高的部分。此外,虽然其余部分技术 相关的成本占比较低,但就其总量而言也不能忽视。
就技术相关的开销而言,视频生产、存储、分发等每个环节都需要不菲的成本支撑,而具 体花费金额则与公司的业务形态、采用的技术手段以及相应的定价明细息息相关。就播放业务 和视频服务相关的技术栈而言,我们可将存在优化空间的几个核心环节概括为:
1)生产:视频转码和审核费用;
2)存储:对象存储 OSS 的存储费用;
3)分发:OSS 流量费用,CDN 带宽费用。
二、定价方式
除了上述视频平台成本相关的核心环节,定价方式是另一个重要指标。我们从阿里云官网 计费模式处截取了不同环节的价格明细,其中转码定价如下图所示:
根据图中转码相关的计费方式,可得出如下结论:
1)转码费用主要受视频时长、输出分辨率、转码格式(H264/H265)等因素的影响。由于转码消耗的是服务器的 CPU 资源,所以转码成本基本上与其消耗的算力成正比。
2)从上表可以简单推断出,H265 需要的算力是 H264 的 5 倍左右;而且分辨率长宽每 分别提高一倍,总体算力也需要翻倍。不管是购买云服务还是自购服务器,这个逻辑都是通用的,区别只是定价的不同。
除了转码以外,计费方案中还包括审核价格。优酷的UGC 业务比较发达,而 UGC 内容 的审核是必不可少的过程,审核定价明细如下图所示:
同样地,将审核相关的优化思路概括如下:
1)审核成本与视频长短直接相关,而与分辨率以及编码格式都无关。
2)基于价格数据,审核相关的成本运算需要关心的因素和画面清晰度无关,因此可以只针 对固定的清晰度进行审核。
3)相对而言,审核成本显著低于 H265 转码的开销,而和 H264 转码开销相当。 在分析完成转码和审核的成本策略之后,再分析一下带宽这个成本开销巨头的优化思路。
阿里云给出的带宽计费方式如下图所示:
针对带宽成本的计费方式,可以采用如下的应对策略:
1)优酷等视频平台的月 CDN 费用大于 10 万,所以会被按照 95 峰值来计算收费。
2)假设每月每天的带宽使用相对均衡,单位成本就会更低。
在详细分析成本时,仅依赖 95 峰值计费方式局限性比较强,如果结合流量计费方式(如 下图)进行综合分析,可信度会大大提高。
在按流量计费方式方面,通过阿里云官网计费明细得知:同样一个产品,按照不同的计费 规则实际上的开销不会差距太大,因此上述分析在不同场景以及不同定价的条件下,误差较为可控,具有一般性。
三、播放体验为何会影响成本
优质的播放体验需要一定程度的成本支撑,二者在大多数场景都存在相互制约的微妙关系。 大家都知道,用户观看视频时消耗的网络流量,在最理想的情况下有如下关系:
播放视频需要的流量 = 下载视频使用的流量 但由于网络抖动以及延迟等因素,如果简单粗暴地看到哪里下到哪里,必然在播放时持续抖动,进而导致卡顿,这是用户绝对不能接受的。基于上述最理想的公式进行简单改进,增加缓冲区如下:
播放视频需要的流量 + 缓冲区大小 = 下载视频使用的流量。 然而,上述公式存在一个隐藏的缩放系数,其取值为[1, ∞),进而更新公式如下:
min(播放视频需要的流量 + 缓冲区最大值, 受网速影响该时间段能下载的最大流量)= 下载视频使用的流量 由此可知,缓冲区最大值无论用什么策略去配置优化,在任何时段内必然是一个大于 0、小于无限大(至少小于设备存储空间上线)的值。所以上述公式在统计意义上的形式为:
播放视频需要的流量 x 固定放大系数 = 下载视频使用的流量
其中,固定放大系数与单视频用户平均观看时长是强相关的,如果用户持续观看不退出就 调小一些,如果用户频繁切换视频就调大一些。因此整体而言,用户情况稳定的情况下,固定 放大系数越大,用户发生卡顿的概率就越小,服务商的带宽成本就越高。至于如何在不增加用 户卡顿概率的情况下尽量降低放大系数,另外有“播放体验优化”的话题会进行详细分析,此处 就不展开分析了。
四、定价如何影响技术决策
我们都知道使用 H265 比 H264 大约会带来 20% 到 30% 的码率节约,这与具体的视频以及转码参数有关。码率节约有两个好处:
1)对用户来说,看片时需要的码率越低,出现卡顿的可能性就越低;
2)对视频平台来说,平均码率的节约就等于 CDN 流量成本的节约。 所以我们把所有视频都转成 H265 是不是就能带来全平台 20% 到 30% 的节约?非常可惜,并不是的。
任何一个视频网站,具体视频的播放频次都是接近呈指数分布的,换句话说,视频热度的 长尾分布极其明显。大部分用户大部分时间集中看少数视频,而大量的视频一个月内仅仅被观 看一次,甚至完全没有人观看。从上文阿里云按流量的定价来看,1GB 流量最低 0.15 元,1080P 及以下视频 H264 格式每分钟 0.0651 元、H265 格式每分钟 0.3255 元。
举例说明 H264/H265 的成本权衡方案,假设一个视频时长为 60 分钟、原始码率为 2Mbps、 H265 转码效率为 20%,其在不同转码格式下的成本明细如下图所示:
需要补充的是,由于当前大量设备不支持 H265,因此 H264 转码成本是无法避免的,此 处不做单独说明。基于上述计算,H265 存储收益和转码成本的收支平衡点为 19.53 / (0.135 -0.108) = 723 次。也就是说,在当前的定价下,一个视频需要用 H265 完整播放 723 次,其CDN 成本降低的收益才能超过其转码的额外开销,从而获得成本节省。而实际上由于用户并不会每 次都完整播放,上述数字还是要打折扣的,基于上述案例,综合考虑后需要 1000 次甚至更多。
类似优酷等视频平台,其视频类型主要包括两部分:
1)官方采买和自制的电视剧、电影和综艺等版权视频:版权视频受制作成本以及生态限制, 数量是有限的;而用户观看热度较高的视频,平台也会倾斜优质的宣发资源,这部分视频播放 量大,版权费用也较高,相对而言,一部视频几十元的转码成本就可以忽略不计了。
2)用户自行录制上传的 UGC 视频:海量的用户上传视频较为长尾、曝光度较为分散, 如果对于总播放次数较低的冷门视频还要进行 H265 转码,就得不偿失了。
对于播放次数少的视频,不但在转码上没有必要生产成 H265,而且在存储分发策略上也 应有所区分。具体而言,由于播放次数太少,每次播放都大概率因无法命中 CDN 缓存而需要 回源,在这种情况下,平台要付出的成本就是 CDN 流量费外加回源流量费。如此一来,不但 额外花了 CDN 的钱,而且没有带来任何好处,还不如从 OSS 直接下载来得经济实惠。
五、成本最优化展望
综上,不仅视频业务是不断变化的,而且视频播放生产等每个环节的成本也是不断变化的, 因此成本优化的策略也会随之变化。为了在满足业务需求的情况下达到整体的成本最优,我们 必然需要彻底了解所有的环节,打通上层业务和底层技术的信息通道,权衡性价比,以持续获 取最好的收益。
抛砖引玉以一个思路作为结尾,当前视频平台内的展示位基本上靠推荐算法和运营配置等 业务手段呈现给用户,那么一个视频可以有多少播放量,以及是否有必要采用 H265 甚至 AV1 等码率更低但是转码费用更高的格式,是完全可以建设一套系统进行精准预测的。另一方面, 在同样转码格式的情况下,微调算法参数也会对成本计算产生较大的影响。所有的一切,都需 要我们针对每一个视频进行精准的成本规划,不放过每一处可优化的细节,聚沙成塔,从而获 得最大限度的成本收益。