论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

一、论文

(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

https://arxiv.org/abs/1902.09630

code:https://giou.stanford.edu

二、论文笔记

1、背景

(1)、深度神经网络的优化,目前主要集中在网络结构的优化,或者提取局部特征的策略上,但是很少有考虑改进损失函数代替之前的L1 L2的,

(2)、在目标检测领域基于距离的损失函数,和最终衡量效果的指标IOU之间存在鸿沟.

 

2、创新点

(1)、使用IoU作为损失——GIoU,并且解决了如果IoU没有重复的情况怎么体现预测和ground之间的距离,或者是损失

计算过程:

论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

GIoU的大小范围是 -1 到 1之间  当两个区域完全重合的时候,值为1,当两个区域相隔非常远的时候,即:论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记时,论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

 

(2)、GIoU损失函数计算过程(这里的坐标系应该x坐标是从左向右的,y坐标系是从上往下的,并且使用的是左上角点和右下角点)

论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记  GIoU损失 等于1 - GIoU

 

3、细节

损失函数方面的trick:

1)、预测bbox参数的平方根来减轻尺度敏感性。(YOLO v1

2)、使用log函数来减轻尺度的敏感性(R-CNN)

3)、L1-smooth loss 对于离群点更加温和(Fast R-CNN

 

IoU作为衡量指标有两个优点:

1)、论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记是一种数学定义上的距离,满足作为距离的一切性质(非负性,不可分辨性恒等式,对称性和三角不等式。)

2)、IoU与目标的尺度无关

 

mAP

mAP 两个平均分别是不同的(1)IoU阈值({.5, .55, · · · , .95}.),以及不同的(2)类别

 

4、实验

(1)、使用GIoU替换原有的回归损失,效果都要好

(2)、Faster R-CNN  and Mask R-CNN的提升没有YOLO v3的提升多,可能是a) 、前两个模型的anchor boxes比较多,因此GIoU在没有重叠区域的情况下的优势就体现不出来。