论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记
一、论文
(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
https://arxiv.org/abs/1902.09630
code:https://giou.stanford.edu
二、论文笔记
1、背景
(1)、深度神经网络的优化,目前主要集中在网络结构的优化,或者提取局部特征的策略上,但是很少有考虑改进损失函数代替之前的L1 L2的,
(2)、在目标检测领域基于距离的损失函数,和最终衡量效果的指标IOU之间存在鸿沟.
2、创新点
(1)、使用IoU作为损失——GIoU,并且解决了如果IoU没有重复的情况怎么体现预测和ground之间的距离,或者是损失
计算过程:
GIoU的大小范围是 -1 到 1之间 当两个区域完全重合的时候,值为1,当两个区域相隔非常远的时候,即:时,
(2)、GIoU损失函数计算过程(这里的坐标系应该x坐标是从左向右的,y坐标系是从上往下的,并且使用的是左上角点和右下角点)
GIoU损失 等于1 - GIoU
3、细节
损失函数方面的trick:
1)、预测bbox参数的平方根来减轻尺度敏感性。(YOLO v1)
2)、使用log函数来减轻尺度的敏感性(R-CNN)
3)、L1-smooth loss 对于离群点更加温和(Fast R-CNN)
IoU作为衡量指标有两个优点:
1)、是一种数学定义上的距离,满足作为距离的一切性质(非负性,不可分辨性恒等式,对称性和三角不等式。)
2)、IoU与目标的尺度无关
mAP
mAP 两个平均分别是不同的(1)IoU阈值({.5, .55, · · · , .95}.),以及不同的(2)类别
4、实验
(1)、使用GIoU替换原有的回归损失,效果都要好
(2)、Faster R-CNN and Mask R-CNN的提升没有YOLO v3的提升多,可能是a) 、前两个模型的anchor boxes比较多,因此GIoU在没有重叠区域的情况下的优势就体现不出来。