Fast-RCNN笔记

Fast-RCNN
继2014年的RCNN之后,作者借鉴了SPP-Net的设计思想,在15年推出了Fast RCNN。
Fast-RCNN笔记
卷积只要做1次获得特征图,将ss算法生成的2000个候选区域映射到特征图上
再做ROI pooling(类似金字塔池化),变成相同维度的数据,再用得到的数据训练回归器和分类器

ROI Pooling(Region of Interest Pooling)

roi pooling层其实是SPP-Net中金字塔池化层的一种简单化的形式,roi pooling层只使用一种固定输出大小的max-pooling。
将每个候选区域均匀分成MxN块(比如3x3块),对每块进行max-pooling。将特征图上大小不一的候选区域转变为大小统一的数据,送入下一层。
Fast-RCNN笔记
Fast-RCNN笔记
Fast-RCNN笔记
原来RCNN通过卷积提取特征后,需要用特征分别单独训练1个回归器和1个分类器

Fast-RCNN把bbox regression放进了神经网络内部,与region分类和并成为了一个multi-task模型,ROI pooling之后通过1个全连接层,全连接层之后同步进行分类和回归。实际实验也证明,这两个任务能够共享卷积特征,并相互促进。这个结构的优化极大提升了模型的训练和预测速度,也为后来的Faster-RCNN做下了铺垫。