[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

分析

目标检测中,边界框回归是很重要的一个组成部分,判断一个边界框回归好坏,一般通过IOU来体现。

优化回归损失与优化IOU之间存在差距

分析一

然而在当前检测算法中,并不是直接优化IOU,而是将IOU decode成(x,y,w,h)或者边界框的两个角点(x1,y1,x2,y2)(x_1,y_1,x_2,y_2),对这几个值进行回归,从而优化IOU,然后实际上这几个值与IOU并不是完全的正相关关系。如下图所示:黑色矩形(预测框),绿色矩形(真实框),用两个角点表示(x1,y1,x2,y2)(x_1,y_1,x_2,y_2),在欧式距离和街区距离相等的情况下,他们的IOU却相差很大。
[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

分析二

基于上述参数定义的范数(欧式距离和街区距离)对于物体的尺寸是敏感的。如果有几个具有相同重叠水平的边界框,但是由于不同尺度,则会产生不同的影响数值

分析三

一些不同类型表示的参数缺乏正则化,如(x,y,w,h)这种表示形式,xy反映了空间的关系,wh却反映了尺寸的关系。

为减少以上问题,目前先进的检测器提供了anchor box,用来提供良好的初始猜测,并定义一些表示来弥补尺寸的变化(如yolov1 宽高用开平方计算loss,v3前面则会有一个系数2-box面积),但即使有这些手动操作,优化回归损失与优化IOU之间还是会有差距

那我们为什么不直接优化IOU呢,有以下两个问题
(1)如果两个物体没有重叠,则IOU为0,不能反映两者的距离关系,无法进行梯度更新优化
(2)IOU区别不出来两个物体的对齐方式(如下图所示,三者具有相同的IOU,但是对齐方式不一样,明显平行对齐的那个框回归的更好,而使用GIOU从左到右分别为0.33,0.24,-0.1,GIOU越大则具有更好的对齐方向)
[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
基于以上问题,提出GIOU

GIOU

[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
计算步骤
(1)计算两个框的最小闭包面积
(2)计算IOU
(3)计算最小闭包中不属于两个框的面积 相对于 最小闭包面积的比重,并用IOU减去他 得到GIOU
GIOU有如下几个特点
(1)与IOU类似,GIOU也是一种距离度量,损失函数为1-GIOU
(2)与IOU类似,GIOU对尺度不敏感
(3)GIOU总是要比IOU要小,并且在两个边界框几乎重叠时,两者几乎没有差距。
(4)IOU的范围是0~1,但是GIOU有对称范围,属于-1 ~ 1
A:和IOU类似,值1表示两个边界框完全重合,即如果 AB=AB|A \bigcap B| =|A \bigcup B|,那么GIOU=IOU=1
B:当两者并集占最小闭包集合比例趋于0时,GIOU为-1(即表示两个边框无限远,此时比例趋于0),即
limABC>0GIOU(A,B)=1lim_{\frac {A \bigcap B}{C}->0} GIOU(A,B) =-1
(5)与IOU不同的是,GIOU不仅仅关注两个边界框的重叠面积,当A与B之间没有很好重叠时,如本文第二章图片中的第三个矩形,最小闭包中除了两者并集之外的空白增加。GIOU就会变小,所以GIOU可以更好地反映两个物体如何发生发生重叠。
具体计算公式
[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression