关于改进GAN论文的看法(1)

摘要:改进GAN是最近网络学习的一个很有趣的方向,不像单纯调参那样,GAN的改进更具有多样化,可以叠加不同网络,修改图片等对网络进行基于自己想法的改进以得到更好的结果。下面先写出两个个人感觉比较有趣的GAN改进论文。

Cycle-GAN:Unpaird Image-to-Image Translation using Cycle-Consistancy Adversarial Network
虽然论文标题是在不匹配的图片间进行风格转换,但是在论文中大部分案例还是匹配的图片之间进行风格转换。例如下图效果:
关于改进GAN论文的看法(1)
网络结构
该相比于GAN,Cycle-GAN有两个生成网络G和F,两个判别网络Dx和Dy,整个网络是一个对偶网络。
损失函数
主要的两个损失是adversarial loss和Cycle consistancy loss。
Adversarial loss是衡量生成图像的分布和目标区域的距离。损失公式如下:
关于改进GAN论文的看法(1)
Cycle Consistancy loss是阻止F与G相互矛盾,看博客里是因为网络需要保证生成的图像必须保留有原始图像的特性,所以如果我们使用生成器GenratorA-B生成一张假图像,那么要能够使用另外一个生成器GenratorB-A来努力恢复成原始图像。此过程必须满足循环一致性。
关于改进GAN论文的看法(1)
限制和讨论
如果训练模型只包括野马和黄种马,那么骑马的人也可能会被转换成斑马条纹。并且Cycle-GAN只能最小化改变输入图片,不能保持物体的几何形状。部分失败案例如下图:

关于改进GAN论文的看法(1)
CartoonGAN:Generative Adversarial Networks for Photo Cartoonization
这篇论文是通过改进GAN来把照片转成某个风格(比如新海诚或者宫崎骏)的风格化图片,效果如下(a)为原始照片,(b)为新海诚风格,(c)为宫崎骏风格:
关于改进GAN论文的看法(1)

网络结构
生成器和判别器如下图:
关于改进GAN论文的看法(1)
改进方面:
该论文为了加快收敛,并且保证Semantic Content能够保持不变,在生成器的初始化阶段,只用语义内容损失预训练了生成器G。

另一方面,在卡通图片中物体的边界清晰是非常重要的,但是边界只占一小部分,该论文为了使内容的边界清晰,在Adversarial loss中又添加了将卡通图的边界模糊后的数据集e进行训练。例如下图:
关于改进GAN论文的看法(1)

总的对抗损失为:
关于改进GAN论文的看法(1)