关于roi pooling层的理解

昨天看到目标检测原理讨论群703346870进行了激烈的讨论。个人理解如下。

1. 概念理解:

ROI, region of interest,感兴趣的(图像后者feature map)区域,数学表示上是一个矩形(x,y,w,h),表示可能出现物体的部位。

FPN, feature pyramid network, 特征金字塔,是一个通用的backbone,类似于resnet

RPN, roi proposal network,roi 建议网络,是产生roi的网络

roi pooling层,对feature map上的roi 进行pooliing

2. 过程的理解

理解1 :图像中roi区域通过cnn网络之后提取的feature中roi,其位置和大小都是成比例对应的。

关于roi pooling层的理解

关于roi pooling层的理解

理解2 :卷积出的feature map可以赋予不同意义

fast rcnn中 RPN网络其实就是几个卷积网络产生可能的roi,是rcnn的升级版,具体思路是让卷积产生的feature map表示物体可能的位置。

YOLO更近一步,让卷积产生的feature map 直接表示物体的位置。

参考资料:

知乎https://zhuanlan.zhihu.com/p/73654026

博客https://blog.****.net/AUTO1993/article/details/78514071

目标检测原理群:703346870(原始论文已上传到该群)

图像分割原理群:425030356

强化学习原理群:112107531

OCR原理群      :643021765

 

目标检测工程群:916212380
图像分割工程群:1030854880

强化学习工程群:1005654907

OCR工程群      :1007648445