基于图像的三维模型重建——稠密点云重建

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

基于图像的三维模型重建——稠密点云重建

作者：梦寐mayshine

链接：https://zhuanlan.zhihu.com/p/131590433

本文转载自知乎，作者已授权，未经许可请勿二次转载。

稠密点云的获取方式

Lidar 扫描
Kinect
结构光
基于图像的方法-Multi-view Stereo

基础知识

极线条搜索
光度一致性约束
可视性约束

多视角立体技术

基于体素的方法
基于空间patch 的方法
深度图融合

一、稠密点云的获取方式

Lidar扫描：精度高(毫米级别)，效率高，有效范围几米到几百米，价格昂贵；高反光，玻璃表面，吸收表面

基于图像的三维模型重建——稠密点云重建

Kinect：使用方便、价格适中、速度较快；精度较低、有效距离短

基于图像的三维模型重建——稠密点云重建

结构光：高精度、高效率、近距离数据获取

基于图像的三维模型重建——稠密点云重建

基于图像的方法：multi-view stereo，无源被动式、成本低、图像来源广、计算速度慢、精度较高

基于图像的三维模型重建——稠密点云重建

二、基础知识

1.极线搜索：参考图像中的一点对应另一幅图像中的一条线段

基于图像的三维模型重建——稠密点云重建

2.光度一致性假设 photo-consistency

同一空间的点在不同视角的投影应当具有相同的光度，重建的核心在于恢复空间中具有光度一致性的点
朗伯反射假设：

基于图像的三维模型重建——稠密点云重建

常用的计算区域广度一致性的度量方式：

Sum of Squared Differences (SSD)
Sum of Absolute Differences (SAD)
Normalized Cross Correlation(NCC)

3.可视性约束

图像中出现的点不能被遮挡
重建的点前面不能出现点
不能出现在物体内部

基于图像的三维模型重建——稠密点云重建

三、多视角立体技术

1.基于体素的方法

规则的划分^[1]：等价于3D空间Voxel标记的问题

基于图像的三维模型重建——稠密点云重建

不规则的划分^[2]：等价于3D空间四面体标记的问题

基于图像的三维模型重建——稠密点云重建

图像上的约束——剪影约束

基于图像的三维模型重建——稠密点云重建

图像上的约束——光度一致性约束

基于图像的三维模型重建——稠密点云重建

常用的优化模型^[3]——典型的MRF离散优化问题

参考图像上每个像素分配一个标签（内部或者外部）
数据项-光度一致性假设
平滑项-邻域假设
可视项-可视性约束

基于图像的三维模型重建——稠密点云重建

优缺点

优点

生成规则的点云
便于提取物体的平面

缺点

精度受到空间划分分辨率的影响
难以处理精度高、规模大的场景

2. 基于空间patch扩散的方法

方法

假设空间中的3D 矩形patch
通过一定规则的扩张方法，使得patch覆盖物体表面
PMVS http://www.di.ens.fr/pmvs/

基于图像的三维模型重建——稠密点云重建

流程

基于图像的三维模型重建——稠密点云重建

初始3D patch的生成

基于图像的三维模型重建——稠密点云重建

patch扩张

基于图像的三维模型重建——稠密点云重建

patch滤波

基于图像的三维模型重建——稠密点云重建

特性

基于图像的三维模型重建——稠密点云重建

3.基于深度图融合的方法^[4]

人的左右眼立体视觉和深度图

基于图像的三维模型重建——稠密点云重建

基本流程

1. 为每一幅图像选择邻域图像构成立体图像对
2. 计算每一幅图像的深度图
3. 进行深度图融合

视角选择

基于图像的三维模型重建——稠密点云重建

邻域的选择——全局视角选择

1. 图像具有相同的内容、外观和尺度
2.图像具有足够大的时差（宽基线）

基于图像的三维模型重建——稠密点云重建

图像尺度的估计——用于衡量图像的分辨率

图像上1个像素的宽度对应的三维空间中的物体尺寸

基于图像的三维模型重建——稠密点云重建

相关视角的选择——局部视角选择

1.NCC值确定候选视角
2.实现要足够分散（不共面）

基于图像的三维模型重建——稠密点云重建

区域生长法扩张

重建的置信度建立优先级队列
从初始的稀疏特征点开始深度估计
对每个种子点进行非线性深度优化
每次优化完后判断以下两种情况，将邻域像素添加到队列中: 1)邻域没有深度值 2) 当前像素的置信度值高于邻域像素一定范围

基于图像的三维模型重建——稠密点云重建

深度值非线性优化

基于图像的三维模型重建——稠密点云重建

深度值非线性优化

基于图像的三维模型重建——稠密点云重建

非线性优化的数学模型

基于图像的三维模型重建——稠密点云重建

颜色尺度的优化

基于图像的三维模型重建——稠密点云重建

最小二乘法

基于图像的三维模型重建——稠密点云重建

的优化-梯度下降法

基于图像的三维模型重建——稠密点云重建

深度值非线性优化——整体框架

只进行深度h(s,t)的优化(迭代4次)
While (迭代次数< 20)
每间隔5次迭代，进行 h(s,t), hs, ht的优化,否则仅优化深度
优化完成后跟踪判断每个视角的置信度
如果视角的置信度太小，或者超过迭代14次尚未收敛，则从局部视角中移除该视角，并重新进行视角选择

深度估计结果

基于图像的三维模型重建——稠密点云重建

深度融合

基于图像的三维模型重建——稠密点云重建

深度融合——一致性约束

基于图像的三维模型重建——稠密点云重建

深度融合——可视性约束

基于图像的三维模型重建——稠密点云重建

总结：

邻域视角选择使得深度估计准确度提升
原理简单，只用到光度一致性约束和可视性约束，适用的场景广泛

基于图像的三维模型重建——稠密点云重建

参考

S.M. Seitz and C.R. Dyer. Photorealistic scene reconstruction by voxel coloring. International Journal of Computer Vision, 35(2):1–23, November 1999.
Sinha S N, Mordohai P, Pollefeys M. Multi-View Stereo via Graph Cuts on the Dual of an Adaptive Tetrahedral Mesh[C]// IEEE, International Conference on Computer Vision. IEEE, 2007:1-8.
V. Kolmogorov and R. Zabih. Multi-camera scene reconstruction via graph cuts. In European Conference on Computer Vision (ECCV), 2002.
M. Goesele, N. Snavely, B. Curless, H. Hoppe, and S. Seitz. Multi-view stereo for community photo collections. In IEEE International Conference on Computer Vision (ICCV),2007.

推荐阅读：

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结（附书籍、网址与****）

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总（下）

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年，我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅！3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会（ICRA/IROS/ROBIO/CVPR/ICCV/ECCV等）、顶刊（IJCV/TPAMI/TIP等）、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

基于图像的三维模型重建——稠密点云重建

▲长按加微信群或投稿

基于图像的三维模型重建——稠密点云重建

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近1000+星球成员为创造更好的AI世界共同进步，知识星球入口：

基于图像的三维模型重建——稠密点云重建

参考

汇总|3D点云目标检测算法

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

相关推荐

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题