DCGAN

https://blog.****.net/liuxiao214/article/details/74502975

https://blog.****.net/liuxiao214/article/details/73500737

https://blog.****.net/czp_374/article/details/81199055

 

重点:DCGAN基本结构和最原始的GAN是类似的,不同点是:D和G中采用了较为特殊的结构,以便对图片进行有效建模。

对于原始的GAN

判别器D,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,输出可以看作是概率。

 

G的输入时一个100维的向量z。它是之前所说的噪声向量。G网络的第一层实际是一个全连接层,将100维的向量变成一个4x4x1024维的向量,从第二层开始,使用转置卷积做上采样,逐渐减少通道数,最后得到的输出为64x64x3,即输出一个三通道的宽和高都为64的图像。

DCGAN

DCGAN

稳定的深度卷积GAN 架构指南:

所有的pooling层使用步幅卷积(判别网络)和微步幅度卷积(生成网络)进行替换。

在生成网络和判别网络上使用批处理规范化。

对于更深的架构移除全连接隐藏层。

在生成网络的所有层上使用RelU**函数,除了输出层使用Tanh**函数。

在判别网络的所有层上使用LeakyReLU**函数。