视频平台技术成本控制的量化方法

作者| 阿里文娱高级无线开发专家 付笑冰

在线视频平台为用户提供服务时,面临的一个严重的挑战是,如何保证在为用户提供流畅且稳定播放服务的前提下,尽量降低整体运营成本。
本篇文章将围绕上述问题,重点讨论技术实践中的成本控制手段。

一、视频平台成本的构成

视频平台在提供播放服务的过程中涉及到非常多环节和技术栈,每个环节都会涉及极其复 杂的计费方式,因此分析视频平台成本的构成是量化的第一步。在拆解成本构成之前,我们先以某视频公司为例进行财报分析,其近期的财报如下所示:

视频平台技术成本控制的量化方法

从上述财报中可以明显看出,相对于逐年增加的营业收入而言,运营成本及费用的增幅更为显著,最终导致净亏损额的逐年递增。显然,降低运营成本和费用的增速,就等同于降低净 亏损、增大收益。
在对成本进行量化控制之前,首先对运营成本和费用的构成进行分析。某视频公司 2019 年 财报关于成本的明细记录如下图所示:

视频平台技术成本控制的量化方法

可以明显看出,除内容成本之外,带宽成本是占比最高的部分。此外,虽然其余部分技术 相关的成本占比较低,但就其总量而言也不能忽视。
就技术相关的开销而言,视频生产、存储、分发等每个环节都需要不菲的成本支撑,而具 体花费金额则与公司的业务形态、采用的技术手段以及相应的定价明细息息相关。就播放业务 和视频服务相关的技术栈而言,我们可将存在优化空间的几个核心环节概括为:
1)生产:视频转码和审核费用;
2)存储:对象存储 OSS 的存储费用;
3)分发:OSS 流量费用,CDN 带宽费用。

二、定价方式

除了上述视频平台成本相关的核心环节,定价方式是另一个重要指标。我们从阿里云官网 计费模式处截取了不同环节的价格明细,其中转码定价如下图所示:

视频平台技术成本控制的量化方法

根据图中转码相关的计费方式,可得出如下结论:
1)转码费用主要受视频时长、输出分辨率、转码格式(H264/H265)等因素的影响。由于转码消耗的是服务器的 CPU 资源,所以转码成本基本上与其消耗的算力成正比。
2)从上表可以简单推断出,H265 需要的算力是 H264 的 5 倍左右;而且分辨率长宽每 分别提高一倍,总体算力也需要翻倍。不管是购买云服务还是自购服务器,这个逻辑都是通用的,区别只是定价的不同。
除了转码以外,计费方案中还包括审核价格。优酷的UGC 业务比较发达,而 UGC 内容 的审核是必不可少的过程,审核定价明细如下图所示:

视频平台技术成本控制的量化方法

同样地,将审核相关的优化思路概括如下:
1)审核成本与视频长短直接相关,而与分辨率以及编码格式都无关。
2)基于价格数据,审核相关的成本运算需要关心的因素和画面清晰度无关,因此可以只针 对固定的清晰度进行审核。
3)相对而言,审核成本显著低于 H265 转码的开销,而和 H264 转码开销相当。 在分析完成转码和审核的成本策略之后,再分析一下带宽这个成本开销巨头的优化思路。
阿里云给出的带宽计费方式如下图所示:

视频平台技术成本控制的量化方法

针对带宽成本的计费方式,可以采用如下的应对策略:
1)优酷等视频平台的月 CDN 费用大于 10 万,所以会被按照 95 峰值来计算收费。
2)假设每月每天的带宽使用相对均衡,单位成本就会更低。
在详细分析成本时,仅依赖 95 峰值计费方式局限性比较强,如果结合流量计费方式(如 下图)进行综合分析,可信度会大大提高。

视频平台技术成本控制的量化方法

在按流量计费方式方面,通过阿里云官网计费明细得知:同样一个产品,按照不同的计费 规则实际上的开销不会差距太大,因此上述分析在不同场景以及不同定价的条件下,误差较为可控,具有一般性。

三、播放体验为何会影响成本

优质的播放体验需要一定程度的成本支撑,二者在大多数场景都存在相互制约的微妙关系。 大家都知道,用户观看视频时消耗的网络流量,在最理想的情况下有如下关系:
播放视频需要的流量 = 下载视频使用的流量 但由于网络抖动以及延迟等因素,如果简单粗暴地看到哪里下到哪里,必然在播放时持续抖动,进而导致卡顿,这是用户绝对不能接受的。基于上述最理想的公式进行简单改进,增加缓冲区如下:
播放视频需要的流量 + 缓冲区大小 = 下载视频使用的流量。 然而,上述公式存在一个隐藏的缩放系数,其取值为[1, ∞),进而更新公式如下:
min(播放视频需要的流量 + 缓冲区最大值, 受网速影响该时间段能下载的最大流量)= 下载视频使用的流量 由此可知,缓冲区最大值无论用什么策略去配置优化,在任何时段内必然是一个大于 0、小于无限大(至少小于设备存储空间上线)的值。所以上述公式在统计意义上的形式为:
播放视频需要的流量 x 固定放大系数 = 下载视频使用的流量
其中,固定放大系数与单视频用户平均观看时长是强相关的,如果用户持续观看不退出就 调小一些,如果用户频繁切换视频就调大一些。因此整体而言,用户情况稳定的情况下,固定 放大系数越大,用户发生卡顿的概率就越小,服务商的带宽成本就越高。至于如何在不增加用 户卡顿概率的情况下尽量降低放大系数,另外有“播放体验优化”的话题会进行详细分析,此处 就不展开分析了。

四、定价如何影响技术决策

我们都知道使用 H265 比 H264 大约会带来 20% 到 30% 的码率节约,这与具体的视频以及转码参数有关。码率节约有两个好处:
1)对用户来说,看片时需要的码率越低,出现卡顿的可能性就越低;
2)对视频平台来说,平均码率的节约就等于 CDN 流量成本的节约。 所以我们把所有视频都转成 H265 是不是就能带来全平台 20% 到 30% 的节约?非常可惜,并不是的。
任何一个视频网站,具体视频的播放频次都是接近呈指数分布的,换句话说,视频热度的 长尾分布极其明显。大部分用户大部分时间集中看少数视频,而大量的视频一个月内仅仅被观 看一次,甚至完全没有人观看。从上文阿里云按流量的定价来看,1GB 流量最低 0.15 元,1080P 及以下视频 H264 格式每分钟 0.0651 元、H265 格式每分钟 0.3255 元。
举例说明 H264/H265 的成本权衡方案,假设一个视频时长为 60 分钟、原始码率为 2Mbps、 H265 转码效率为 20%,其在不同转码格式下的成本明细如下图所示:

视频平台技术成本控制的量化方法

需要补充的是,由于当前大量设备不支持 H265,因此 H264 转码成本是无法避免的,此 处不做单独说明。基于上述计算,H265 存储收益和转码成本的收支平衡点为 19.53 / (0.135 -0.108) = 723 次。也就是说,在当前的定价下,一个视频需要用 H265 完整播放 723 次,其CDN 成本降低的收益才能超过其转码的额外开销,从而获得成本节省。而实际上由于用户并不会每 次都完整播放,上述数字还是要打折扣的,基于上述案例,综合考虑后需要 1000 次甚至更多。
类似优酷等视频平台,其视频类型主要包括两部分:
1)官方采买和自制的电视剧、电影和综艺等版权视频:版权视频受制作成本以及生态限制, 数量是有限的;而用户观看热度较高的视频,平台也会倾斜优质的宣发资源,这部分视频播放 量大,版权费用也较高,相对而言,一部视频几十元的转码成本就可以忽略不计了。
2)用户自行录制上传的 UGC 视频:海量的用户上传视频较为长尾、曝光度较为分散, 如果对于总播放次数较低的冷门视频还要进行 H265 转码,就得不偿失了。
对于播放次数少的视频,不但在转码上没有必要生产成 H265,而且在存储分发策略上也 应有所区分。具体而言,由于播放次数太少,每次播放都大概率因无法命中 CDN 缓存而需要 回源,在这种情况下,平台要付出的成本就是 CDN 流量费外加回源流量费。如此一来,不但 额外花了 CDN 的钱,而且没有带来任何好处,还不如从 OSS 直接下载来得经济实惠。

五、成本最优化展望

综上,不仅视频业务是不断变化的,而且视频播放生产等每个环节的成本也是不断变化的, 因此成本优化的策略也会随之变化。为了在满足业务需求的情况下达到整体的成本最优,我们 必然需要彻底了解所有的环节,打通上层业务和底层技术的信息通道,权衡性价比,以持续获 取最好的收益。
抛砖引玉以一个思路作为结尾,当前视频平台内的展示位基本上靠推荐算法和运营配置等 业务手段呈现给用户,那么一个视频可以有多少播放量,以及是否有必要采用 H265 甚至 AV1 等码率更低但是转码费用更高的格式,是完全可以建设一套系统进行精准预测的。另一方面, 在同样转码格式的情况下,微调算法参数也会对成本计算产生较大的影响。所有的一切,都需 要我们针对每一个视频进行精准的成本规划,不放过每一处可优化的细节,聚沙成塔,从而获 得最大限度的成本收益。

上一篇:数据分析实际案例之:pandas在餐厅评分数据中的使用


下一篇:netty系列之:channel,ServerChannel和netty中的实现