数字图像和视频处理基础学习第一部分笔记

1.The Pinhole Camera

在针孔相机模型中，x,y代表着投影在某个平面的位置，而z表示光轴即图像距离相机/小孔的距离。

因此，我们的目标就是根据实际物体的x,y,z计算出相机投影平面上物体的x,y；用公式表示就是x=-fX/Z, y=-fY/Z.

数字图像和视频处理基础学习第一部分笔记

2.Parallel lines converge to a vanishing point

在3-D模型中原本平行的线条在2-D平面上会交汇到一个点上.

证明：

我们先设置一个A点和三维向量D,因此我们可以将任意一点用A点和一个三维变量表示出来。

数字图像和视频处理基础学习第一部分笔记 ,

同时根据Pinhole中的计算公式我们可以得到：

数字图像和视频处理基础学习第一部分笔记

若我们考虑 Lambda ->无穷就可以得到：

数字图像和视频处理基础学习第一部分笔记

This expression do not depend on A.

因此我们根据相似可以得出y的计算公式。

我们在回归到之前的图片中，图片中实际物体的Y=-h, y=-f*h/Z;

suppose Z->INF so y-> 0

nearer point y will be more negative

数字图像和视频处理基础学习第一部分笔记

3. Nearer objects look bigger

set the pole bottom at(X,-h,Z) and top at(X,L-h,Z)

the height of the object will be L.

While bottom project to (f*X/Z,-f*h/Z) and top project to(f*X/Z,-f*(L-h)/Z) .

the different is f*L/Z so the large Z means the smaller object we looks.

4. A projection model that avoids inversion

数字图像和视频处理基础学习第一部分笔记

5. Orthographic projection

数字图像和视频处理基础学习第一部分笔记

当物体的大小相对于Z是很小的时候，对于物体f/Z都可以看做为alpha.

当Z1-Z2的数值相对于Z来说是很小的时候，就可以用到上述的办法。

这就是我们老师给的computer vision学习资源前两集的学习笔记。还有好几章的视频课好好学吧。