谷歌大脑刷新coco准确率 EfficientDet: Scalable and Efficient Object Detection

文章开头说,现在的检测网络,大的准确但是速度慢,速度快的精度低。而谷歌大脑的这篇论文,使用了EfficientNet作为backbone,再加上BiFPN,结合成了EfficientDet,这个模型现在是paper with code上coco数据集的第一名:
谷歌大脑刷新coco准确率 EfficientDet: Scalable and Efficient Object Detection
其实解决的问题,是上篇目标检测中的不平衡问题中第五节规模不平衡(scale imblance)里说的特征不平衡(feature imblance)。即怎么有效且正确的利用各层特征,
谷歌大脑刷新coco准确率 EfficientDet: Scalable and Efficient Object Detection
看这篇文章里列举的方法:谷歌大脑刷新coco准确率 EfficientDet: Scalable and Efficient Object Detection
d就是bifpn的结构,前三个有各自的问题,c因为gpu耗时太大了,它的箭头是用神经元来处理特征;a很明显p7最后输出的信息没有包含p3的影响;b是PA net,一观察不难发现,他与d(bifpn)的区别就是跳链接。
BiFPN对箭头的权重也进行了归一化,以防止训练时不稳定。
这和DetectoRS很相似,都是为了更好的利用backbone的低层次和高层次的信息。事实证明都能提高检测的准确率。
这其实就是特征上的不平衡问题,个人虽然这个问题仍然可以继续做文章,但是已经很难找点了,不如多看看其他。