The introduction of Stereo 立体视觉+DSI视差空间图像
深度信息是人类产生立体视觉的前提
基本透视投影
只有一个摄像机时,图中线段OP上的点在图像上的投影点均为p,因此但摄像机无法获得深度信息。
当摄像机为两个时,就可以获得深度信息
其中f是焦距长度,B=Tx 为基线,通俗的讲就是两个摄像机中心的距离,好比人两只眼睛的距离,Z为深度,d是视差,d=xl-xr
这样我们就把求深度转换为了求视差的问题
通过极线约束(epipolar constraint),我们可以将两幅图像间的像素匹配减少到一条线上,但是这样会导致一些问题,因此我们在对扫描线加入一致性约束
Disparity Space Image–DSI–视差空间图像
英文定义:The DSI for one row represents pairwise match scores
between patches along that row in the left and right image.
DSI是一种矩阵,存储两条扫描线中每个像素的匹配分数
这是*上对DSI的解释:
https://*.com/questions/33067476/what-is-meant-by-disparity-space-images
把每个匹配分数的向量作为一列写入这个矩阵中
这就是视差深度图像