《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读

github地址:https://github.com/assafshocher/ZSSR

一、简介

本文提出了一种基于深度学习的SR(超分)方法——ZSSR,与以往的深度学习方法需要依赖大量数据集不同,本文强调“Zero-Shot”,即 0 样本学习(其实是在测试阶段,从待超分的LR图像中提取出一些训练对,来进行训练)。ZSSR利用了图像的非局部自相似性——即对于大多数自然图像而言,图像某一处的纹理、结构会在该图像的其它地方多次、重复地出现。如下图所示:

《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读

上图中的圆形洞口和扶手栏杆以不同的尺度出现了多次, 而只有基于图像内在信息的SR(Internal patch based SR)对上面的两个小的扶手栏杆有一个较好地重建。传统的有监督网络VDSR却忽视了这部分的信息,这是因为这种扶手栏杆只会在该图片的内部出现,而不会在其他的外部数据集中出现(即使这个数据集很大)。

 

二、数据集(这是本文的一个重点)

既然是深度学习方法,必然是三步走(准备数据、定义模型、训练)。本文的训练数据集是从待超分的 LR(低分辨率) 图像 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 中提取出来的(如下图(b)所示),这是和其他深度学习方法(如下图(a)所示)相比一个很大的不同:

《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读

(1)将 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 进行下采样,得到 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 ,这些图像在后面将会作为HR图像进行训练,因此称为“HR fathers”;每个HR fathers 再以期望的超分尺寸因子 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 进行下采样(默认bicubic),得到的图像在后面将会作为LR图像进行训练,因此称为“LR sons”。这样就获得了初步的 LR-HR 训练对。

(2)进行旋转(《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读)和镜像(垂直、水平),即将训练集扩展了8倍(x8)。

(3)用(1)和(2)得到的训练集来训练网络,得到训练好的模型,再将 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 通过该模型即得到对应的超分图像 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读

(1)、(2)、(3)的示意图如下所示:

《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读

(4)对于很小的图像做较大尺度(《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读)的超分,作者将 SR 过程逐步执行,这样同时也增强了网络的鲁棒性。过程如下:令《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读,对于每一个超分因子 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 ,获得 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 对应的超分图像 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 ,利用(1)、(2)方法再获得 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 构成的 "HR fathers",并将其加入到前面已获得的 "HR fathers" 中(《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 利用(1)、(2)构成的),将这些 “HR fathers" 以 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 进行下采样,获得对应的 “LR sons” ,即获得了新的 LR-HR 训练数据集,进行尺度为 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 的超分。 重复上述操作直到完成 《“Zero-Shot” Super-Resolution using Deep Internal Learning》论文阅读 的超分。

 

三、网络结构

这部分作者描述地很简单:是一个残差结构、含有8个隐藏层的全卷积网络,每个隐藏层都是60个通道;网络输入与输出同尺寸(输入是LR图像通过插值上采样成HR尺寸的图像,这也是一种常用的策略)。