【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection

论文地址:Single-Shot Refinement Neural Netwok for Object Detection
论文时间:2017.11发布,2018.01最终能修改


全文概括

  本文发表于DSSD之后,其基本框架结构形状与DSSD大概一致(上采样手段也使用的是转置卷积 deconvolution)。不同的地方在于,其(1) 在骨干网络的特征提取过程中,增加了一个RPN(Faster RCNN中的)的筛选与调整功能(去除部分的明显的负框,并调整anchor的大小);(2) 在down-top路径与top-down路径的feature map元素相加融合时,增加了一个连接模块(TCB,transfer connection block)

  本文所提出的网络名字叫做 RefineDet。其由两个主要模块组成:(1) anchor refinement module(ARM); (2) objection detection module(ODM);同时,设计一个连接模块(TCB)来连接两个模块。ARM的功能有两:a. 过滤负框以减少检测器的搜索空间(也是解决one-stage检测器类别不平衡问题的一个方法);b. 粗略地调整anchors的位置和大小,从而为接下来的检测器提供更好的初始化。

  RefineDet 在COCO数据集上的效果和SSD差不多,mAP为41.8%(SSD300为41.2, SSD321为45.4,SSD513为50.4);RefineDet320的FPS为40.2,RefineDet512的FPS为24.1,SSD300的FPS为46,SSD321的FPS为16,SSD513的FPS为8.

网络结构:【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection
转换连接模块(TCB):
【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection


网络模型

  Two-Step Cascaded Regression,两步级联回归的优势:作者认为,之前的在多个level 的 feature map直接预测的方法(DSSD、SSD、RON),对某些具有挑战性的问题效果不好,比如小目标的检测上。所以,本文通过ARM,从而给anchors更好的初始化,以减少分类和回归的误差。当其检测边框为负的置信度比较高时(高于阈值θ\theta),就将其在丢地,参与训练ODM的过程中。