助力全站WebP ,阿里云云上FPGA 团队发布 WebP图片解决方案

目前来说,图片依旧是占用流量较大的一部分,对于移动端更是如此,因此,如何在保证视觉效果的同时缩小体积,对于解决带宽占用高和手机耗电快非常重要。然而,我们所熟悉的 JPEG、PNG、GIF 等常用图片的优化早已到了极致。

因此 Google 在2010年推出了新的图片压缩格式——WebP,致力于在达到和 JEPG 格式相同的图片质量的同时,减少文件大小,希望能够减少图片在网络上的传送时间。

WebP 为图片提供了有损和无损压缩能力,根据官方实验,无损 WebP 相比 PNG 减少 26%左右大小,有损 WebP 在保证结构相似性的情况下比 JPEG 减少 25%~34%大小;有损 WebP 的大小通常约为对应 PNG 的34%

受限于JPG、PNG等格式图片转码速度慢的影响,这么厉害的技术,却只有国内的少数公司在使用。阿里云 推出了新的 WebP 图片解决方案,来帮助更多的企业,能够使用 WebP 格式,享受 WebP 格式带来的便利。

阿里云为 WebP 编码做了什么?

阿里云 WebP 图片解决方案的软件部分由联捷计算科技(CTAccel)提供,再整合上阿里云自身的FaaS (FPGA as a Service) 弹性计算平台,形成了完整的阿里云 WebP 图片解决方案。阿里云 WebP 图片解决方案在 ECS 产品可靠、安全、便利的基础上,进一步发挥了 FPGA 在数据并行处理上的能力,满足用户的计算需求,优化程序的运转效率。

联捷计算科技一直致力于FPGA的图片处理与分析加速计算技术的研发,核心技术已获得美国专利。核心产品提供的图片处理能力,重新定义了数据中心图片处理计算模式,为互联网图片计算提供最高效的解决方案。

用户能够在该平台上使用 JPEG 解码和 WebP 编码系统,能够实现批量将 JPEG 图片转换成不同分辨率的 WebP 图片。相比于传统的 CPU 处理方案, 基于 FPGA 加速的 WebP 图片解决方案为图片处理提供了数倍的性能提升。

真实场景下的性能对比

测试对照组1

本组对照实验基于 FaaS F1 ecs.f1-c28f1.7xlarge 实例(28 CPU Cores, 1 Intel A10 FPGA Card)

测试图片组参数: 10000 张图片, 平均大小: 830k, 分辨率: 4096x2160, 总计 8.3GB

测试结果

助力全站WebP ,阿里云云上FPGA 团队发布 WebP图片解决方案

测试结果解读

我们可以看到,由于 FPGA 运算加速的介入,在各个分辨率下, FPGA + CPU 组(蓝色)都要比单纯的 28 核 CPU 组有较大的性能提升,加速比平均可达 3.24倍!而且,我们也可以看到,图片尺寸更大, 加速效果越明显。对于使用者来说,能够用更短的时间处理更多的图片,带来成本上的降低和性能上的提升。

测试对照组2

本组对照实验基于 FaaS F1 ecs.f1-c28f1.7xlarge 实例(28 CPU Cores, 1pcs Intel A10 FPGA Card)

测试图片组参数: 10000 张图片, 平均大小: 130k, 分辨率: 1024x768, 总计 1.3GB

测试结果

助力全站WebP ,阿里云云上FPGA 团队发布 WebP图片解决方案

测试结果解读

当输入图片切换成1k时,我们可以看到,受限于输入图片的尺寸, FPGA 的加速效果相比于对照组1略有下降,但 FPGA + 28 核CPU 组的处理速度仍然比单纯的 28 核 CPU组提升了 2.54倍。

测试对照组3

本组对照实验基于 FaaS F1 ecs.f1-c8f1.2xlarge 实例(8 CPU Cores, 1pcs Intel A10 FPGA Card)

测试图片组参数: 10000 张图片, 平均大小: 830k, 分辨率: 4096x2160, 总计 8.3GB

测试结果

助力全站WebP ,阿里云云上FPGA 团队发布 WebP图片解决方案

测试结果解读

在本组测评中,由于实例的 CPU 数量下降,FPGA的加速效果相比于前两组测试结果得到了大幅度的对比放大。 FPGA + 8 核 CPU 组对比单纯 8 核 CPU组提升了 6.5 倍!

测试对照组4

本组对照实验基于 FaaS F1 ecs.f1-c8f1.2xlarge 实例(8 CPU Cores, 1pcs Intel A10 FPGA Card)

测试图片组参数: 10000 张图片, 平均大小: 130k, 分辨率: 1024x768, 总计 1.3GB

测试结果

助力全站WebP ,阿里云云上FPGA 团队发布 WebP图片解决方案

测试结果解读

本组测评虽然 CPU 数量减少, FPGA 的加速性能被对比放大出来,但受限于输入图片的尺寸,性能的提升仅达到 3.75倍。

综合测评结果

通过我们上面的四组测评结果可以得出以下结论:

  1. 同等情况下,加入 FPGA 性能将有大幅度提升,平均提升在2.5倍以上, 最优能达到 6.5 倍。
  2. 图片越大, FPGA 的加速效果越好。这样符合我们的场景,图片越大,我们压缩的需求越强烈。
  3. CPU 越少,FPGA 的相对加速效果更明显,在保证处理速度的情况下,我们可以选择使用 CPU 更少的 FPGA 机器处理,取得更高的性价比。

普惠 FPGA 的力量

在过去,FPGA 只是互联网玩家大咖才能玩得转、玩得起的,但是阿里云希望让更多的企业和个人享受算力提升带来的好处。

阿里云 将 FPGA 封装成云产品,并在原有基础上进行产品化、模块化、镜像化,全方位优化产品交付流程,对于任何一家想要使用 FPGA 或是能够为其他公司提供 FPGA 技术指导和开发服务的企业,都能够在整个流程中找到自己。FPGA 的云端交付,让更多的企业能够从不会用到用的爽!

即使你的企业没有人擅长 FPGA ,仍然可以通过购买云市场的开发服务,并通过统一的交付流程,实现无编码,轻松上云。

为了无法计算的价值,普惠 FPGA 的力量,让 WebP 从这里崛起!

上一篇:PHP特性_CTF Show


下一篇:介绍几个好用的工具类