卷积神经网络－目标探测

目标探测
- 单个目标
- 多个目标
- 直接思路：局部识别
传统方法：DPM deformable parts model
- 基本思想：
  - 提取图像特征，制作出激励模版，在原始图像滑动计算，得到激励效果图，根据激励分布确定目标位置
- 优点：
  - 方法直观简单
  - 运算速度快
  - 适应运动物体变形
- 缺点：
  - 性能一般
  - 激励特征人为设计，工作量大
  - 大幅度旋转无法适应，稳定性差
神经网络分类： R-CNN系列方法
- 类别减少
- 训练过程
- 测试过程
- 分类器的训练：
  - 直接用ImageNet模型
  - Fine-tune分类模型
    - 选择20类进行探测；对原始分类模型结构更改，最终21个目标
  - 特征提取
    - 图片计算候选区域；候选区域切分图片，变成输入大小；提取相应高级特征；存储特征
  - 单独目标探测器训练–基于候选区域微调
- 测试过程：
  - 候选区域
  - 特征计算
  - 分类、回归
  - 后续处理
- 评估方法：
  - mAP：mean average precision 平均精度
RCNN总结：
- 优点：
  - CNN用于目标探测，利用CNN高效识别能力，大大提高性能。
  - 摆脱人为设计物品模版，方法具有通用性
  - 分类+回归，有了找到精确位置的可能
- 缺点：
  - 为了检测一个目标，所有候选区域计算，大量卷积运算，非常慢
  - SVM训练与CNN断裂，有效信息不能用于优化模型
  - 每一类单独训练，异常繁琐
    https://blog.****.net/briblue/article/details/82012575
Fast R-CNN
- 共享卷积计算
  - 卷积计算保持空间位置
  - 共同区域卷积计算只进行一次
  - 切割候选区 + 提取特征图 = 计算完整特征图+切割对应候选区
- 特征一致化：max pooling
- 相对位置回归+类别分数判定联合学习
- 怎么解决候选区域的生成问题
  - 神经网络特征增加一组输出（RPN） region proposal network
    - 直接产生候选区域，无需额外生成
    - 直接用于后续特征图切割
    - 简介
      - 在feature map上滑动窗口
      - 建一个神经网络用于物体分类+框位置的回归
      - 滑动窗口的位置提供了物体的大体位置信息
      - 框的回归提供了框更精确的位置
  - anchor box
    - 引入应对目标形状的变化问题（anchor就是位置和大小固定的box，可以理解成事先设置好的固定的proposal）。
      https://blog.****.net/qq_41329606/article/details/82658927
      https://cloud.tencent.com/developer/news/281788
Yolo训练

卷积神经网络－目标探测

相关推荐