GLEAN
作者认为目前主要有两类SR方法。一是 ESRGAN和 SinGAN这种Feedforward Network。这类方法主要是encoder-decoder的模式。
最近用得比较多的方法GAN-Inversion。GAN-inversion通过找到GAN网络中的latent verctor(latent code),再使用这个latent vector通过预训练的GAN模型去生成图像…设置loss, 迭代更新…。GAN-Inversion的大致结构如下,可以参考stylegan-encoder。
应用到SR的文章PULSE和DGP。
这类方法的主结构如图所示。
然后就是文章中的网络结构。
这里的网络结构为32x32 => 256x256 (8x)。作者在github的model有两个,分别是猫16x和ffhq16x,输入大小为64x64,输出为1024x1024。
Linux安装环境(windows好像不太支持安装mmcv-full),一顿操作后…。根据作者提供的ffhqx16复现了两张图像。输入是64x64,输出是1024x1024。
效果大家自己欣赏吧。