视频云的全景蓝图，想象力的允诺之地

2022-03-05 03:33:29

视频有边界吗？

在过去，答案是肯定的。

那时视频可能会被锁在电视机里，关在大银幕中。可随着越来越多的硬件设备进入家庭，随着网络技术层层变革，随着计算能力持续升级，随着视频的编解码能力不断提升…… 视频，已然成为一种新的信息载体，而作为新时代大视频产业的底座，视频云就被赋予了可以变革社会的关键使命。

7 月 10 日，“Imagine”——2021 阿里云视频云全景创新峰会暨全球视频云创新挑战赛决赛颁奖典礼在北京举办。关于视频未来的发展前景，关于视频云的全景蓝图，关于学术界、艺术界、创投界多界联动，关于开发者与音视频技术领域的多维探索，通过这场峰会的观点碰撞，我们似乎已然能够窥到未来视频发展的康庄之路。

从视频化到超视频化，视频云角色加码

在前几年，视频化一词被越来越多的提及。那么什么是视频化？

简单来讲，就是信息的传递逐渐加入了视频作为载体。由于视频生产门槛持续的降低，用户接受度不断提高，用户使用时长也在不断增加，内容全视频化时代已然到来。与此同时，视频不仅仅在消费领域大放异彩，在教育、会议、医疗、金融等各行各业也在衍生出新的需求。

用户花在视频上的整体时间消耗明显在增加，整个社会基于视频在各种各样的业务场景中的交互也上升明显。“内容在更多的向视频演进，交互的形式更加多样，相比以前的视频化来讲，这是一个超视频化时代。” 阿里巴巴研究员、阿里云智能视频云负责人林昊如此定义当前的这些变化。

想要定义一个时代，就需要了解这个时代。林昊解释称超视频化时代有五大特点，超内容，超交互、超链接、超语言能力及超未来图景。解析来看，其意味着视频的形式持续演进，交互更加丰富，其传播跨越了语言限制，并且还能够以 AR、VR 等途径影响到大众的日常。

那么超视频化的时代是怎样到来的呢？林昊认为 5G 起到了重要的推动作用，5G 的大带宽推动了 AI 与 IoT 发展为智联网；5G 激活了超高清视频与 VR/AR，使得网络峰值速率达到了 20Gbit/s，无线接口延时 1ms，分辨率显著提升；更为重要的，5G 开拓了数字内容的新业态，无论是数字游戏、互动娱乐、影视动漫、立体影像还是数字表演等，视频的表现能力和形式都得到了极大的丰富。

更为关键的还在于，云 + 视频形成了场景革新的催化剂，让虚实结合成为了可能。云边端一体化协同让边缘算力上移，云端算力下沉，降低了处理压力和时延问题；而云端一体化的音视频技术使得双端体验一致成为可能；AI 技术发展后实现了视频全链路的赋能，智能化颠覆了以往的内容生产方式；同时，混合现实技术也突破了内容和交互的新形态，使得物理世界和数字世界的最后一道壁垒被打破链接起来，让视频这一载体拥有了更多的可能。

乔布斯说过，“在较低的带宽下，人们传递的是信息，更高的带宽将用来传递情感。” 超视频化时代的诞生不仅仅是因为带宽的提升，还因为技术的演进。

技术演进则分为了两大方向，即内容的演进和交互的演进。内容的演进路径遵循更大密度、更多维度、更多感官、拓扑空间四大特征，其具体表现也就形成了从文字、到图像、影音、直播短视频、资讯及知识的视频化，乃至全场景内容视频化，最终形成沉浸式内容形态。交互的演进则遵循了多端链接、多人共享、打破空间、虚实无缝融合的特征，演进路径就形成了从线下、线上、交互全场景线上化到沉浸式交互的过程。

由此不难发现，沉浸式交互和内容形态将会是我们能够探知的真正未来。“信息将会从一个交互对象，自然地传递到另一个交互对象。而数字将与物理共存并增强。”

像《头号玩家》一样的交互方式绝非天方夜谭。当然，在一切想象力的背后都是技术的深度挖掘，视频的背后不会是对 AI、数据、编解码等单点技术的升级，而是要求以视频云为基础的整个技术体系的打造。视频云不仅仅是云端的技术，还要在视频整体技术上不断演进，不管是三维化还是全息化，都要不断的演进和布局，最终让视频与场景有更多结合，从而实现数智化音视频赋能的 “云上创新，价值创造”。

大视频产业的底座，视频云的行业演进

伴随超视频化发展，互联网也在发展。而在评估某一行业的价值时，已经不再是用设备数，而是时间数。当互联网各个领域的红利已经近乎枯竭之时，视频相关领域却在去年表现出巨大的红利。并且艾瑞研究院副总经理徐樊磊表示，这一红利还将持续下去。

从行业发展的角度来看，现阶段的大视频产业具有碎片化、去中心化、高清化、实时性等一系列的特点，也就是说在需求端大家对于视频的追求越发趋于 “短、频、快”，追求极致画质体验，需要实时音视频，实时交互重塑视频应用价值，从而覆盖到金融服务、医疗、公共事业、社交、教育、咨询等诸多行业。

而如果我们把视角抬高，纵览人类历史当中信息传播的历程，那么视频在其中扮演的角色也十分重要。最初，人类的沟通更多的是肢体语言，其对体力要求很高且容易歧义；随后，人类有了语言，其不会有体力问题却会被空间时间束缚，且很难传承下去；后来我们有了文字，传承千年已然无忧，但是文字天生的门槛和信息丰富度的缺乏促使视频的出现。而视频也在持续演进，从最初的电视，到离线的播放器视频，再到现在的实时音视频以及互动视频。

而视频依然不是完美的，其主要问题有两点，第一是视频的线性问题，其虽然可以快进到某个地方却无法实现全局纵览；第二则是修改相比文字较慢，难度也更高。而基于这些问题，行业会越来越多的来与视频进行结合。也就是说视频已经不再是行业，而是一种底层的基础能力，基于视频云打造的视频应用会成为必选项。视频成为必选项，因此可以说，“视频云是新时代大视频产业的底座”。

行业与视频的深度结合其影响绝不仅仅是产品，很多行业的格局因此而改变。但是由于行业的复杂性存在，其对于视频能力的诉求各不相同却又有一定的共同之处。首先便是要求易于集成、易于计量，其需要以更低的成本、更弹性的扩缩容以实现云上的尝试，能够敏捷试错快速投入生产。

因此，视频云需要在生产、处理、传输、消费等不同环节提供不同的解决方案和流程加持。除了视频本身被云服务深度和分工细化之外，其还能够大幅降低制作高质量、有价值视频的门槛。

这一过程中云服务对视频的加持极为重要，在视频生产环节，视频云能够提供智能化的内容处理能力，大幅提高创作效率和实现高效的媒资管理。在处理环节，视频云通过视频处理和智能编码，达到成本和画质的最优平衡。在传输环节，视频云基于 CDN 智能加速，云边端协同，降低传输时延和节省带宽成本。在最终的消费环节，视频云还能提供美颜、美声、沉浸式交互等多元化玩法丰富用户体验。

视频云在结合了行业之后自身也在持续的演进。现阶段视频云虽然主要集中在互联网和泛娱乐领域中，但其已然具备了不同环节中提供支持的能力，能够在各个行业中持续深度演进发展；同时，视频云解决方案也给了用户更多选择，无论是应用级能力，还是行业性通用型平台企业，不同维度不同用户，能够有不同的答案。

此外，视频云在技术层面依然在追求极致，其虽然并未真正成熟，去解决高清化、实时化和互动性的问题，但是软件定义一切的理念正在协同硬件处理如路由器、存储、计算等诸多环节；同时，低代码开发也在大量的视频云及视频产业中出现，其可以让从业者更快速、更敏捷的调用功能，提升易用性，实现易调用、易集成。

未来，基于视频云有可能会打造更多的创新，其能够为用户提供更多的链接，更低的门槛，展现更普惠的能量。视频云这种技术对于视频整体行业及大视频产业而言，就是成为了一个底座功能。

视频云的可持续发展，技术的难点与突破

视频云作为产业底座，其一大特质便是兼容并包。尤其是当下，用户对于视频互动性、呈现方式和沉浸式体验需求增加，AI 的深度融入将会成为视频云及视频产业创新的关键。当视频云在社交、娱乐、教育等领域开荒拓土之时，深度学习也在图像、语音、语言、大数据特征提取等多个方面持续发挥出巨大价值。可以说，未来视频云技术的突破，一定程度上将由基于深度学习的人工智能所驱动。

在活动最后的圆桌论坛中，中国科学院计算技术研究所智能信息处理实验室研究员王树徽则表示，深度学习时代带来了第三次人工智能的兴起，此次兴起主要以应用为目的，使得深度学习技术在很多任务有着良好效果，但其内核却存在问题。因此，想要实现视频技术的突破，从深度学习内在机理方面应当解决三大技术问题。

第一，现有的深度学习太过依赖数据，其对数据的处理性能和对知识的利用是不够的，所以基于这个考虑做网络多模态跨媒体数据的知识构建将会是未来的一大重要发展方向；
第二，要建好知识库，来支撑机器系统的推理工作，从而让机器能够对任意不同来源的数据形成举一反三的推理能力。
第三，早期的时候人对计算机来说是不对等的，比如内容创作时的人机协同。而在核心过程当中，算法、系统和人之间是需要可信的，相互的信赖、协作及可信赖的推理将会是为了主要需要解决的问题。

当然，AI 虽然有很多问题存在，却也一样在视频之中发挥了重要作用。达摩院资深算法专家谢宣松表示，AI 在视频方面发挥的作用主要分成两类，第一类是最基础的视频或者图像的理解，包括分类、打标、检测、分割等等；第二类与生产类相关，比如生产、编辑、加工、擦除、擦入等等，其中还包括底层视觉相关的增强等。

视频的图像增强是 AI 的一大应用方向，分辨率低时候视频的信息量体验将会非常差，更生动的色彩也会让体验加分；而更加沉浸式的体验则是为了发展的方向。如果想要打造一款 4K 内容，细节、流畅度和色彩比如是需要关注的重点。但是从技术角度来看以下三大问题必须要直接面对，第一，越是追求细节就越可能出现瑕疵，如何保证细节还原且能够保证瑕疵控制，这是很核心的技术；第二，算法的源头是数据，数据的源头普遍有两种，如低分辨率和高分辨率，低画质和高画质，数据获取最终往往需要用人工方式这种高成本的方式解决，这也是一大难点；第三，在 AI 技术实践当中，把效果和效率平衡做好也是一个问题。

当前 AI 也在朝着两个维度走，一个是走向消费者，为大家服务，另一个则是深入到各行各业来降本提效，创造各种各样的机会。

当然，驱动创新和技术升级的，归根结底依然是人。那么 AI 热度已经高涨很多年了，很多学校也开启了 AI 相关人才与教育，但对于市场和行业而言，人才缺乏问题依然严重，那么人才都去哪里了呢？王树徽表示，他带过的研究生大多数都已经加入了行业战场，学校已经给行业输送了大量的人才，但是因为行业发展实在太快，高水平人才本就稀少，不同实验室定位不同，也无法盲目扩大规模。

同时，实验室的研究是把问题从现实中剥离出来再通过数学的方法来解决问题的，可是企业对于学生的要求是不同的，他们会希望企业了解业务并用以实践。从学术研究到业务应用这本身就有很长的链条，学生难以实现即插即用。而意识到这一点的显然不仅仅是学校，还有行业和企业。

今年阿里云联手英特尔主办、与优酷战略技术合作的全球视频云创新挑战赛在此次峰会上举办最终的颁奖典礼。本届大赛由天池平台和阿里云视频云承办，聚焦于视频云技术在全行业的应用与创新领域，吸引了全球 23 个国家、4000 余支参赛战队，大赛分为 “算法 “和” 创新应用 “两大赛道，充分发掘人才，鼓励并期待参赛者激发未来更多的想象力。

此外，阿里云天池平台在此次峰会上还发布了天池数据集开源计划，涵盖电商、金融、物流、医疗、能源等 60 多个有真实业务场景的产业稀缺数据集，希望通过开放真实的业务场景和数据，与各界社会力量一道打造专业的科研大数据平台。

视频云的发展成为了时代的选择，也变革了商业与社会，化作大视频产业的底座；视频云技术可以充满想象力，突破时间与空间，也能让人与人的沟通更加无缝和惬意。

码农公寓

视频有边界吗？

从视频化到超视频化，视频云角色加码

大视频产业的底座，视频云的行业演进

视频云的可持续发展，技术的难点与突破

相关文章