Fast-RCNN

论文:Fast R-CNN

代码地址:https://github.com/rbgirshick/fast-rcnn

先说一下性能吧,Fast R-CNN较R-CNN在速度上提升到了5帧/S并且在mAP上也大约提升了3.2%.

好了,现在我们来看看Fast R-CNN的神奇之处吧。Fast R-CNN的框图如下图所示:

                             Fast-RCNN

从图中我们可以发现,其在RCNN网络的输入上做了些许的改变,也就是提出了ROIPooling层。该

层可以将输入的不同尺寸的Proposal规范到相同的尺寸中,之后再通过RCNN网络进行前向和反向

传播。ROIPooling层的原理其实非常的简单,即对输入的Proposal按照一定的尺寸进行均匀分割并

对每一块进行最大池化运算,例如,输入的Proposal大小为h×w,输出大小为H×W,则分割后每一

块的大小为(h/H)×(w/W),实际运算时可能会有四舍五入的情况。

后面的网络结构和RCNN很相似,只是这里的batch size为128,即每张图片采样64个Proposal,并且

25%的为正样本。

另外Fast-RCNN中还引入了SVD来提升运算速度,但是这一创新在实际编程时可以通过减少通道数等

来进行替代。最后Fast-RCNN在VOC上的具体性能可以看下表:

                        Fast-RCNN

最后的最后,如果想了解更多关于CV的知识可以关注下方公众号

                                                        Fast-RCNN