论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

Yang X, Xu K, Song Y, et al. Image correction via deep reciprocating hdr transformation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 1798-1807.

代码:https://github.com/ybsong00/DRHT

摘要:

图像校正的目的是将输入图像调整为视觉上令人满意的图像。现有的方法主要是从图像像素处理的角度提出的。它们不能有效地恢复曝光不足/过度区域的细节。在本文中,我们回顾了图像的形成过程,并注意到这些区域的缺失细节存在于相应的高动态范围(HDR)数据中。这些细节可以被人眼很好地感知到,但由于色调映射过程,在低动态范围(LDR)域中会减弱。因此,我们将图像校正任务描述为一个HDR变换过程,并提出了一种新的方法,称为深度往复HDR变换(DRHT)。给定一个输入LDR图像,我们首先在HDR域中重建缺失的细节。然后,我们对预测的HDR数据执行色调映射,以生成包含恢复细节的输出LDR图像。为此,我们提出了一个由两个CNNs组成的HDR重建和色调映射的统一框架。它们是端到端的集成,用于联合训练和预测。在标准基准上的实验表明,该方法与目前最先进的图像校正方法相比具有良好的性能 。

 

现有的方法在校正曝光不足或过曝的图像方面存在一定的局限性,这是因为这些区域周围的像素值接近于0,而其中的细节会减少。目前的相机仍然需要摄影师曝光时间,而且依赖于相机的相应函数(CRFs)将一个自然场景(S)转换成一个LDR图像(I)。

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

然而,当选择了不合适的曝光时间时,现有的CRFs既不能纠正ccd中的原始数据,也不能纠正输出的LDR图像。这导致了在LDR图像中曝光不足/过曝。基于这个过程,本文作者提出DRHT 进行图像修正。它包含两个CNN网络。第一个CNN网络重建了HDR域中缺失的细节,第二个CNN网络将细节传输回LDR域中。通过往复的HDR变换过程,在中间HDR域中对LDR图像进行校正。

 

 

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

HDR Estimation Network: 

网络基于全卷积的编解码网络

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)  S 表示恢复的HDR数据,f1 是HDR Estimation Network, 网络参数为sigma1, 所有的卷积层都使用batch normalization 和 ELU **函数。

Loss function:

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

Y : ground truth HDR image

α和γ是两个常数, 非线性函数将HDR数据转化为LDR 

在将这个网络与其他模块集成之前,我们预先对它进行了预训练。

LDR Correction Network:


结构于HDR estimation network 相同,目的是保存恢复的细节在LDR领域。

Loss function:

首先见HDR estimation network 得到的结果S 应用 反gamma 矫正 映射到 HDR域 得到 S_full。(因为S是LDR域),

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT)

log()函数是用于压缩的完整HDR域以实现收敛, 同时保持相对较大的强度范围, 和δ是一个小的常数避免零值。

论文阅读笔记------Image Correction via Deep Reciprocating HDR Transformation(DRHT): 一个平衡参数来控制HDR重建精度的影响。

 

联合训练策略:

我们开始训练编码器部分和LDR校正网络中最浅的解码器卷积层,方法是冻结所有其他更高的解码器卷积层的学习率。在训练过程中,逐步增加较高的解码器卷积层进行微调,同时降低编码器和较浅解码器卷积层的学习率。通过这种方式,该网络可以学习将HDR细节以一种由粗到细的方式传输到LDR域。

实现细节:

使用9×9和5×5的卷积核大小,为两个网络的前两个conv层及其对应的反卷积层生成64维特征图,其余的卷积核大小设置为3×3。

为使损失最小化,我们采用亚当优化的初始学习率为1e-2 300次迭代, 然后使用5e-5 带动量的学习率, β1 e-5 = 0:9 β2 = 0:998 进行100次迭代。

α=0:03,γ=0:45, δ=1/255

还进行了修剪梯度,以避免梯度爆炸的问题。一般训练时间为10天左右,测试时间为0.05s左右 一副256×512的图片。