DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR

这篇我主要关注通过gan网络生成的预测

首先我们的输入包括真实前置帧X,真实待预测帧Y,生成器G,判别器D
在训练判别器时，我们将真实的X,Y打包成（X,Y）
在训练生成器时，我们将X与高斯分布Y’打包得到（X,G(X)）并将它作为输入
输入判别器中
判别器的训练

我们将真实待预测帧定义为1，将生成器生成帧定义为0
对于真实图片，我们尽可能让D(X,Y)=1,
对于生成图片，让D(X,G(x))=0
视频预测论文（GAN）（1）-DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR

Lbce表示交叉熵

生成器的训练
对于生成图片，让D(X,G(x))=1
视频预测论文（GAN）（1）-DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR

然后通过随机梯度下降法进行训练

训练网络
生成器，映射为(m+n)*h*w->(m+n)*h*w
判别器，映射为(m+n)*h*w->[0,1]

实验结果：
数据集：UCF101

1帧和2帧预测
视频预测论文（GAN）（1）-DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR

1帧和8帧预测
视频预测论文（GAN）（1）-DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR

这里我们可以看到，当预测帧数较多时，SSIM不是很高，这篇论文比较早，看之后的论文有没有解决。

视频预测论文（GAN）（1）-DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR