Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC

发表在2017年DCC。

这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。

指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。

以下摘一些精彩的叙述,同时重点看清楚实施细节。

精彩叙述

  • 提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。

  • 在解码端增强视频质量,等价于提升了压缩效率。

  • 这种方法受益于端到端训练,并且可以拓展至视频压缩标准。

  • 由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。

  • JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。

  • 我们无需修改编码器。

  • 作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。

细节

DCAD:Deep CNN-based Auto Decoder。

Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC

  • 训练目标:MSE损失。

  • 网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。

  • 作者试过20层,效果并没有更好。

  • 在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。

  • 对于高QP模型,作者将低QP模型迁移过来,以更好地学习。

  • 图像为YCbCr三通道,只在亮度通道上增强。

  • HM 16.0压缩,考虑了QP = 22,27,32,37。

  • AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。

  • 最后一层的学习率是全局的1/10。

上一篇:关于Java的移位运算符


下一篇:python-整理-logging日志