FPN作用
类似图像金字塔,在论文笔记中记录的一样,模拟人的视觉,从远到近观察物体:

顶部-低分辨率 检测到的是尺寸更大的物体
底部-高分辨率 检测到的是尺寸更小的物体
FPN提出

- a每层都预测一次,缺点:计算量太大
- b最后一层预测,浅层关注细节,高层关注语义,所以很多网络(AlexNet\VGG\ResNet(有考虑一点连接上层信息))使用最后一层预测类别
- c应该是b的基础上多加上浅层的预测输出,缺点:不鲁棒
- d就是FCN,L2 1*1卷积降维,L4上采样,处理后相加得L5
其他
待完善…
参考
FPN详解