AI论文探讨室·A+·第10期
《DeepStereo: Learning to Predict New Views from the World’s Imagery》
主要解决的问题:首次使用神经网络预测新的视点图
主要描述
新视点的像素生成是使用将临近视点的图像输入到卷积神经网络中,最后生成新视点的图像。它的有优势主要在,只需要一系列的不同位姿下的图像,然后就可以在不同场景下生成新的视点。
系统架构
该网络由两部分组成颜色塔和选择塔组成,其中颜色塔和选择塔具有相同的结构,但是它们的参数不共享。
选择塔和颜色塔
选择塔生成重聚焦后图像的归一化后的深度图,颜色塔为每个平面重聚焦的图像。将颜色塔和重聚焦图像进行加权得到最后的合成图像。
效果对比
通过对比可以发现,论文生成的结果与参考图像基本相似,但是在细节中仍然存在很多的不足,尤其是场景中的行人等等。
主要工作
(1)首先实现端到端的新视点预测网络模型设计
下一步研究工作
(1)提升系统的速度;
(2)输入图像的数量目前是固定,需要进行优化调整;