FPN论文笔记

1.介绍

1.1.介绍

本文基于《Feature Pyramid Networks for Object Detection》翻译总结。FPN即特征金字塔网络,在微不足道的代价(计算、存储)下,利用了深度卷积网络中内在的multi-scale 金字塔特征层,在特征提取方面取得了良好的效果。

2.相关知识介绍

2.1.Featurized image pyramid图像金字塔

FPN论文笔记
在人工特征领域大量使用。如上图所示,是对不同大小的图片提取特征进行预测。推理时间会相应的的增加,4层就增加4倍,所以此方法在实际应用中有点不太现实。像SIFT特征提取是基于这种图像金字塔的。

2.2.Pyramidal feature hierarchy金字塔特征层

FPN论文笔记
深度卷积网络也会计算不同的特征层,存在内在的multi-scale,金字塔形状。上图是single shot detector(SSD)的模型图。
不过faster-R-CNN一般建议使用单尺度的特征,主要是为了在准确率和速度间权衡。

3.FPN

FPN论文笔记

如上图所示,FPN包括三部分,分别是bottom-up 通路,top-down 通路,一个横向连接(包含上采样、1*1卷积减少channel维度)。这样就既有低分辨率语义强的特征,又有高分辨率语义弱的特征。