irca slam与深度学习结合论文总结
1 UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning
文档存放名称:1-UnDeepVO
Abstract总结:本文提出一个新的VO系统,可以实现单目图像的6个自由度的姿态估计,主要亮点:(1)采用无监督的深度学习架构 (2) 可以恢复出绝对的尺度。
疑问:1 如何使用深度学习来构建VO系统,如何训练,最后的预测结果(6维姿态估计,深度)如何得到?
主要架构:
Introduction总结:
基于模型或者几何的VO分为特征法和直接法,取得不错的效果,但是有一些缺点:对相机参数敏感、对复杂环境难以胜任(弱纹理、运动模糊、光照复杂)。数据驱动的VO或者基于深度学习的VO由于鲁棒性好具有很大的潜力,如最开始将深度学习应用在重定位,使用rgb图像作为输入用CNN做6个自由度的姿态估计,给定光流使用基于CNN的端到端VO系统,基于RCNN的VO方法取得和基于模型的方法接近的性能,DeMoN可以同时估计相机运动和图像深度、表面法向量和光流,还有基于深度学习的VIO。
但是上面的方法存在一个问题就是需要相机位姿的真值和深度图像来进行训练。这个问题可以使用无监督的深度学习VO来解决。无监督深度学习的VO主要用于深度估计,后面有人用左右双目的光度差损失函数进一步提升了深度估计的性能,进而有人使用单目来估计自身运动和深度但是不能恢复尺度。
UnDeepVO主要贡献:(1)利用时空关系提出一种无监督学习的单目VO系统(2)估计位姿和图像深度的同时可以恢复尺度(3)系统在KITTI上表现不错
系统概述