目标检测(二)

目标检测是计算机视觉中一个传统的问题,基本流程可以看做:
特征提取–> 模型训练(分类)–> 滑动窗口计算响应(可以做多尺度)---->非极大值 等基本步骤
传统的目标检测方法:svm+hog, DPM等,这里就不详细解释了。

卷积神经网络目标检测的发展:
R-CNN —> fast R-CNN —> faster R-CNN ----->yolo —>ssd---->FPN

1、R-CNNRich feature hierarchies for accurate object detection and semantic segmentation
这是一个很符合传统目标检测流程的方法,CNN类似的作为特征提取器。然后使用SVM分类,并用回归其对坐标进行回归。
缺点是,图像进入网络之前要生成大量的proposal 区域,存在重复计算卷积的情况,效率低
2、fast R-CNN
目标检测(二)
特点:

  • 减少重复卷积
  • Region Proposal 依然耗费时间

3、faster R-CNN
特点:
目标检测(二)
使用RPN网络,生成Anchor区域,并对其回归和分类(物体或背景),代替Region Proposal 节省时间。