[论文解读]Graph-Based Parallel Large Scale Structure from Motion

基于图的并行大尺度场景重建

为啥有了这篇论文解读吧……是我随便浏览看到的,扫了两眼发现这论文方法我以前做比赛用过(比赛具体内容在这),然后就继续看了下去发现比我以前做的方法好多了,虽然本质是一个思路。

我们在做三维重建时候,特别是图片特别多,场景特别大的时候,其实现有很多SFM程序都会出现特别差的结果(OpenMVG、Colmap)。这类方法是增量式重建的(OpenMVG也有全局的),程序慢慢加图片时候会增加误差,虽然有BundleAdjustment,但是由于增量式的三维重建并没有很好的初始相机位姿,图片加着加着变多了,前面阶段优化负担积累过于沉重导致后面想改也改不过来。这都是我个人理解,很简单例子,colmap就算用video模式重建个房间也会大概率崩掉。但是一个SLAM系统就能得到相对很高的精度。
再说个题外话:我感觉SFM这类重建算法出发点是想重建一个物体,就是相机围绕着某个物体重建;但是SLAM这种其实是相机在物体里面定位建图;这也算两种方法一大不同吧,不单单是实时性问题。
解决这种问题方法也很简单,我直接先全局大致算下位置,作为初始值再添加照片不就行了么,确实如此,这就是Global SFM的出发点。
回到本文的3D reconstruction,其实就是基于Colmap开发个pipeline,把一大堆照片先分成小组,每个小组重建,重建的结果再合并。
[论文解读]Graph-Based Parallel Large Scale Structure from Motion
先写到这,刚才看了看后面的实验,我觉得得下载个代码试验下。