卷积神经网络-目标探测
分类:
文章
•
2025-02-21 22:00:40

- 目标探测
- 传统方法:DPM deformable parts model
- 基本思想:
- 提取图像特征,制作出激励模版,在原始图像滑动计算,得到激励效果图,根据激励分布确定目标位置
- 优点:
- 缺点:
- 性能一般
- 激励特征人为设计,工作量大
- 大幅度旋转无法适应,稳定性差
- 神经网络分类: R-CNN系列方法
- 类别减少
- 训练过程
- 测试过程
- 分类器的训练:
- 直接用ImageNet模型
- Fine-tune分类模型
- 选择20类进行探测;对原始分类模型结构更改,最终21个目标
- 特征提取
- 图片计算候选区域;候选区域切分图片,变成输入大小;提取相应高级特征;存储特征
- 单独目标探测器训练–基于候选区域微调
- 测试过程:
- 评估方法:
- mAP:mean average precision 平均精度
- RCNN总结:
- 优点:
- CNN用于目标探测,利用CNN高效识别能力,大大提高性能。
- 摆脱人为设计物品模版,方法具有通用性
- 分类+回归,有了找到精确位置的可能
- 缺点:
- 为了检测一个目标,所有候选区域计算,大量卷积运算,非常慢
- SVM训练与CNN断裂,有效信息不能用于优化模型
- 每一类单独训练,异常繁琐
https://blog.****.net/briblue/article/details/82012575
- Fast R-CNN
- 共享卷积计算
- 卷积计算保持空间位置
- 共同区域卷积计算只进行一次
- 切割候选区 + 提取特征图 = 计算完整特征图+切割对应候选区
- 特征一致化:max pooling
- 相对位置回归+类别分数判定 联合学习
-
怎么解决候选区域的生成问题
- 神经网络特征增加一组输出(RPN) region proposal network
- 直接产生候选区域,无需额外生成
- 直接用于后续特征图切割
- 简介
- 在feature map上滑动窗口
- 建一个神经网络用于物体分类+框位置的回归
- 滑动窗口的位置提供了物体的大体位置信息
- 框的回归提供了框更精确的位置
- anchor box
- 引入应对目标形状的变化问题(anchor就是位置和大小固定的box,可以理解成事先设置好的固定的proposal)。
https://blog.****.net/qq_41329606/article/details/82658927
https://cloud.tencent.com/developer/news/281788
- Yolo训练