论文SDP + RCNN | Exploit All the Layers: Fast and Accurate CNN Object Detector with SDP and CRC


本文提出了两种目标检测的措施,兼具精度与效率:1.scale-dependent pooling (精度)2. layer wise casaded rejection classifiers(效率)

1 Introduction

1. Fast-RCNN由于是从pooling层bounding box所以不能准确的识别小物体,不能判断,不能判断bbox是否太小。
2. Multi-scale输入因为储存和计算量的问题不容易在非常深的网络应用。
3. 将数以百计的bounding box池化并送入高维fc层,会非常的耗时
本文通过scale-dependent pooling(SDP)层来处理目标的scale variation等问题。具体思路是:不同尺寸的物体可能在不同的层上得到不同的反应,比如可能小的object会在浅层得到一个strong activation,但是大的物体可能在深层得到strong activation。
本文的第二个贡献是提出了cascaded rejection classifier。根据boosting classifiers 的原理,作者因为前面基层是一个弱分类器,他可以快速的否定一个easy negative。于是得到了下面的框架:
2 Related works Neural network cascades

3 Scale-Dependent pooling

如上图所示,SDP是将Fast rcnn中不同尺寸的proposal输入不同的sdp层中,如0-64像素高的proposal就给第三个卷积层的sdp,如果大于128就输入到第五个。每个sdp层后都有fc层。这样做的好处就是不需要大量的resize图片,节省了计算,另外不同的特征层处理不同的proposal可以得到更consistent signal。
本文共有3个SDP,每个有2个fc+relu dropout.

4 Cascaded Rejection classifiers

加了SDP的Fast rcnn也加入了额外的4个fc层,所以为了减少计算量作者提出了CRC来减少proposal的数量,结构如下:
具体思路是:当一个proposal经过卷基层时会的到一组特征,使用fastrcnn里的roipooling策略得到mxmxc个CRC Rls的特征,对于所有的proposal如果是foreground其分类标签是1,否则是0,于是转化为了adaboost的训练形式,每个Rls训练50个弱分类器,训练之后再进入Rl+1s继续训练。

5 Experiments

作者使用的是Edgebox proposal ,augment with ACF。

