深度学习——DRD-Net

CVPR2020原论文:Detail-recovery Image Deraining via Context Aggregation Networks
开源代码( tensorflow框架):https://github.com/Dengsgithub/DRD-Net

1.主要工作:提出了双分支去雨网络。一个分支为基于压缩激励机制(squeeze-and excitation ,SE)的雨残差估计网络,SE能够获取图像上下文特征信息以完成去雨;另一个分支为(structure detail context aggregation block ,SDCAB)图像细节恢复网络,恢复因去雨导致的图像细节损失。即,一个分支去雨,另一个分支恢复图像细节。

2.网络主体架构:
深度学习——DRD-Net
1)雨残差估计网络:
残差学习对于降噪、去雨等图像重建任务具有独特优势。这是因为一般的噪声图像都比重建图像更加稀疏。因此,残差学习不是直接得到重建图像,而是先学习得到噪声图像,然后由输入图像减去噪声图像(残差图像)得到重建图像。下图为残差网络结构图:
深度学习——DRD-Net
该网络将输入图像O映射输出为雨残差图像R。第一个红色块为卷积层,可理解成编码器,完成图像特征提取。中间为16层的雨残差块(蓝色)。最后两个红色块为卷积层,可以理解为解码器,生成雨残差图像。
雨残差图像损失函数计算MSE如下:
深度学习——DRD-Net

其中f(…)表示网络非线性映射。
该部分利用squeeze-and excitation (SE)获取图像上下文特征信息。文章将SE块融合到 残差连接中形成新的雨残差块(蓝色块)。雨残差块的具体结构如下:
深度学习——DRD-Net
虚线部分为SE块。

空间上下文信息是单幅图像去雨的有效信息。然而,在一般的卷积运算中,同一卷积层的不同特征通道是独立的,相关性很小。因此,文章将SE融合到残差连接中。由于SE可以模拟不同特征通道之间的相关性,我们可以通过赋予更大的权重来强化具有更多上下文信息的特征通道。相反,具有较少空间背景信息的特征通道被赋予较小的权重。在训练过程中,雨残差网络将自动学习不同通道的所有权值。

2)图像细节恢复网络:
深度学习——DRD-Net
第一个红色块为卷积层,可理解成编码器,完成图像特征提取。中间为16层的structure detail context aggregation block(SDCAB)块(橙色),其能够提取多尺度特征。最后两个红色块为卷积层,可以理解为解码器,生成细节恢复图像。structure detail context aggregation block块的结构如下:
深度学习——DRD-Net

同时为了使用更大的感受野去提取更多的上下文信息(有利于获取重建细节信息),文章在SDCAB块中嵌入了扩张卷积聚合层(DCCL)。如上图所示,DCCL采用了三种扩张卷积层,扩张因子分别为1,3,5。因此,其具有提取多尺度特征的能力。为了丰富特征信息,将三种扩张卷积的特征进行融合,然后用1*1Conv降维,最后得到DCCL的输出。
该部分的损失函数依旧计算MSE:
深度学习——DRD-Net
其中g(O)表示含雨图像经过细节重建网络后得到的细节图像。去雨图像(Ip,i)=含雨图像(O)-雨纹图像(R)。Ii是去雨图像的ground truth。该损失函数相当于去雨图像减掉ground truth,再加上获取的图像细节。

3.总损失函数:
深度学习——DRD-Net
总损失函数是两个分支网络损失函数的加和,其中λ为权重值。

上一篇:迟来的每日se训练


下一篇:Java 9 逆天的十大新特性