计算机视觉历史回顾与介绍 CS231n李菲菲

生物进化

计算机的历史可以追溯到很早以前,动物拥有视觉的开端
动物物种爆发,出现食肉和猎食者,应为眼睛的出现

照相暗盒——为了复制我们看到的世界

照相暗盒 达芬奇 通过小孔成像的相机
复制我们看到的世界
包括后面的电影的发明

哺乳动物的视觉处理机制是怎样的

生物的大脑是如何处理视觉信息的 5.4亿年进化
哈佛大学教授使用 电极探针插进猫的处理视觉区域的大脑中进行观察与判断。他们提出了“哺乳动物的视觉处理机制是怎样的”,通过观察何种刺激会引起视觉皮层神经的激烈反应,他们发现猫的大脑的初级视觉皮层有各种各样的细胞,其中最重要的是当它们朝着某个特定方向运动时,对面向边缘产生回应的细胞。
计算机视觉历史回顾与介绍 CS231n李菲菲他们发现视觉处理是始于视觉世界的简单结构,面向边缘,沿着视觉处理的途径的移动信息也在变化,大脑建立了复杂的视觉信息,直到它可以识别更为复杂的视觉世界。

视觉被简化为由几何形状构成

计算机视觉的历史是从60年代开始,从Larry Roberts的计算机视觉的第一篇博士论文开始。其中视觉世界被简化为简单的几何形状,目的是能够识别他们,重建这些形状是什么。
计算机视觉历史回顾与介绍 CS231n李菲菲

视觉是分层的

70年代后期David Marr撰写的一本非常有影响力的书,他认为我们认知事物不是看整体的框架,而是看他的边缘和线条,重要的领悟:视觉是分层的,从线条开始识别,
2D:边缘草图
2.5D:遮挡问题
3D:空间感
计算机视觉历史回顾与介绍 CS231n李菲菲

两个重要的结论

整个世界由简单的数学模型构成,比如圆柱体
简单的部分构成,多样性,由弹簧结合

近代发展

90年代彩色的图像
分割有意义的部分,像素分组,感知分组
智能理解人脸 富士相机 人脸检测 ,但是目标识别的方向是一个大趋势

IMAGENET 500万数据100类分类