【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection

论文地址：Single-Shot Refinement Neural Netwok for Object Detection
论文时间：2017.11发布，2018.01最终能修改

全文概括

本文发表于DSSD之后，其基本框架结构形状与DSSD大概一致(上采样手段也使用的是转置卷积 deconvolution)。不同的地方在于，其(1) 在骨干网络的特征提取过程中，增加了一个RPN(Faster RCNN中的)的筛选与调整功能(去除部分的明显的负框，并调整anchor的大小)；(2) 在down-top路径与top-down路径的feature map元素相加融合时，增加了一个连接模块(TCB，transfer connection block)。

本文所提出的网络名字叫做 RefineDet。其由两个主要模块组成：(1) anchor refinement module(ARM); (2) objection detection module(ODM)；同时，设计一个连接模块(TCB)来连接两个模块。ARM的功能有两：a. 过滤负框以减少检测器的搜索空间(也是解决one-stage检测器类别不平衡问题的一个方法)；b. 粗略地调整anchors的位置和大小，从而为接下来的检测器提供更好的初始化。

RefineDet 在COCO数据集上的效果和SSD差不多，mAP为41.8%(SSD300为41.2， SSD321为45.4，SSD513为50.4)；RefineDet320的FPS为40.2，RefineDet512的FPS为24.1，SSD300的FPS为46，SSD321的FPS为16，SSD513的FPS为8.

网络结构：【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection
转换连接模块(TCB)：

网络模型

Two-Step Cascaded Regression，两步级联回归的优势：作者认为，之前的在多个level 的 feature map直接预测的方法(DSSD、SSD、RON)，对某些具有挑战性的问题效果不好，比如小目标的检测上。所以，本文通过ARM，从而给anchors更好的初始化，以减少分类和回归的误差。当其检测边框为负的置信度比较高时(高于阈值 $\theta$ )，就将其在丢地，参与训练ODM的过程中。

【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection

相关推荐