数字图像和视频处理基础学习第一部分笔记
1.The Pinhole Camera
在针孔相机模型中,x,y代表着投影在某个平面的位置,而z表示光轴即图像距离相机/小孔的距离。
因此,我们的目标就是根据实际物体的x,y,z计算出相机投影平面上物体的x,y;用公式表示就是x=-fX/Z, y=-fY/Z.
2.Parallel lines converge to a vanishing point
在3-D模型中原本平行的线条在2-D平面上会交汇到一个点上.
证明:
我们先设置一个A点和三维向量D,因此我们可以将任意一点用A点和一个三维变量表示出来。
,
同时根据Pinhole中的计算公式我们可以得到:
若我们考虑 Lambda ->无穷就可以得到:
This expression do not depend on A.
因此我们根据相似可以得出y的计算公式。
我们在回归到之前的图片中,图片中实际物体的Y=-h, y=-f*h/Z;
suppose Z->INF so y-> 0
nearer point y will be more negative
3. Nearer objects look bigger
set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)
the height of the object will be L.
While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .
the different is f*L/Z so the large Z means the smaller object we looks.
4. A projection model that avoids inversion
5. Orthographic projection
当物体的大小相对于Z是很小的时候,对于物体f/Z都可以看做为alpha.
当Z1-Z2的数值相对于Z来说是很小的时候,就可以用到上述的办法。
这就是我们老师给的computer vision学习资源前两集的学习笔记。还有好几章的视频课好好学吧。