论文阅读练习（9）

《Improved Training of Wasserstein GANs》（2017）

作者：

论文阅读练习（9）

摘要

生成对抗模型是一个很强的生成模型，但是训练不稳定。最新提出的沃恩斯坦GAN（Wasserstein GAN）提高了GAN的稳定训练，但是有时候仍会出现差的例子或发散。发现这些问题通常由于在WGAN中权重衰减的使用在判别器上加强了李普希兹约束（Lipschitz constraint），导致不理想的表现。此篇文章中提出了一个权重衰减的替代选择：惩罚判别器关于它的输入的梯度模。这个方法在标准WGAN上表现更好，并且能在不同的几乎没有超参微调的GAN结构上稳定训练，包括101-ResNet和带有连续生成器的语言模型。同时提高了CIFAR-10和LSUN bedrooms的生成质量。

问题：GAN训练不稳定，产生差的结果或者发散，原因是权重衰减在判别器上加强了李普希兹约束。

补充：原WGAN——利用Wasserstein距离产生一个价值函数，其理论性质好于原始GAN.

方法：We propose an alternative to clipping weights: penalize the norm of gradient of the critic with respect to its input。

衰减权重的替代：惩罚判别器关于其输入的梯度模。WGAN-GP（梯度惩罚WGAN）。要求判别器必须位于1-Lipschitz函数空间内，作者通过权重衰减强制实现。

效果：在标准WGAN上表现更好，并且能在不同的几乎没有超参微调的GAN结构上稳定训练，包括101-ResNet和带有连续生成器的语言模型。同时提高了CIFAR-10和LSUN bedrooms的生成质量。

论文阅读练习（9）

加入梯度惩罚的判别器loss:

论文阅读练习（9）

《Global Context for Convolutional Pose Machines》（CVPR2019)

作者：

论文阅读练习（9）

摘要

卷积pose机制对于铰接式pose估计是一个受欢迎的神经网络结构。此篇文章中，通过探索经验感受野发现它可以通过整合全局信息加强。提出类似U形状的全局信息模块，并且与语义分割领域的金字塔pooling、空洞金字塔空间pooling模块比较。提出的网络在数据集Look Into Person上单人pose估计的PCKh=87.9%。此网络的小版本fps=160，且只有2.9%的错误。在MPII上做网络的泛化测试，达到同样精度但运行更快。

code：https://github.com/opencv/openvino_training_extensions/tree/develop/pytorch_toolkit/human_pose_estimation

问题：针对铰接式pose估计问题

方法：整合全局信息加强感受野。提出一个全局信息模块。

论文阅读练习（9）

效果：提出的网络在数据集Look Into Person上单人pose估计的PCKh=87.9%。此网络的小版本fps=160，且只有2.9%的错误。在MPII上做网络的泛化测试，达到同样精度但运行更快。

论文阅读练习（9）

论文阅读练习（9）

相关推荐