1.计算机视觉导论

1.计算机视觉导论

解决的问题

分类,检测,分割

1.计算机视觉导论

Single Object

  • Classification
  • Classification + Localization

Multiple Object

  • Object Detection 有些像素里面是目标的,有一些是背景的,所以背景的就是冗余了。
  • Segmentation(分割最难),就像是PS的抠图

Semantic Segmentation 语义分割:分割的时候,每个像素进行分类,就是按类分,所以猫与猫之间是没有界限的,同一类物体时被分在一起。

Instance Segmentation 实例分割:将不同的物体扣出来。

1.计算机视觉导论

三个关键

  1. 硬件的算力
  2. 样本数据
  3. 模型的算法

目标检测方法分类

两阶段方法:先从图像上提取候选框,再对每一个候选框进行逐一的甄别,最终把置信度高的候选框,筛选出来,展示出最后的结果。

eg. R-CNN, Fast-RCNN, Faster-RCNN, Mask-RCNN.

缺点:速度比较慢,就像RCNN需要提取2000多个框,那就浪费了很多的算力,但是很准确。

单阶段方法:不需要提取候选框,直接把图像放进去,就可以得到结果,所以速度就非常快。

eg. YOLO、SSD