目标检测总结

任务

常规的目标检测任务是对各种不同尺寸的目标检测,本方法针对小目标进行检测,使用场景为地铁站火车站的人头检测、遥感图像、卫星图像小目标检测。
目标检测总结

创新点:

  • 移除了原始YOLO框架的全连接层,使用了全卷积的方式,删除了(771024)4096(7730)的最后两个全连接层,参数只有原始YOLO的10%,取而代之的是使用kernel=33 stride=2 padding=1的卷积下采样得到N5HW大小的特征图作为预测结果,其中5通道,各个通道表示(class, bbox左上角x坐标,bbox左上角y坐标,bbox右下角x坐标,bbox右下角y坐标)
  • 采用适应性高分辨率训练(adaptive high resolution training method):因为是全卷积网络没有全连接层,所以对输入尺寸的不敏感的。先采用低分辨率训练7000batch,batch size=16,在使用原始分辨率训练2000batch
  • 多尺度训练:给定一个最小分辨率和一个最大分辨率,图片随机裁剪到该范围大小,提高模型的泛化性能。
  • 两种训练策略提升2个mAP的百分点,COCO数据集在25ms/image的速度下达到0.35mAP。
  • 提出新的优化策略:融合了AdaGrade+Momentum新的优化策略,训练效率不如Adam但效果优于Adam。
  • 解决模型训练过慢问题:使用Nvidia dali解决CPU瓶颈,Automatic Mixed Precision解决GPU瓶颈、内存盘解决数据IO瓶颈。

目标检测总结

目标检测总结

目标检测总结