论文：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

一、论文

(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

二、论文笔记

1、背景

（1）、深度神经网络的优化，目前主要集中在网络结构的优化，或者提取局部特征的策略上，但是很少有考虑改进损失函数代替之前的L1 L2的，

（2）、在目标检测领域基于距离的损失函数，和最终衡量效果的指标IOU之间存在鸿沟.

2、创新点

(1)、使用IoU作为损失——GIoU，并且解决了如果IoU没有重复的情况怎么体现预测和ground之间的距离，或者是损失

计算过程：

论文：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

GIoU的大小范围是 -1 到 1之间当两个区域完全重合的时候，值为1，当两个区域相隔非常远的时候，即：论文：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记时，

（2）、GIoU损失函数计算过程（这里的坐标系应该x坐标是从左向右的，y坐标系是从上往下的，并且使用的是左上角点和右下角点）

论文：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记 GIoU损失等于1 - GIoU

3、细节

损失函数方面的trick:

1)、预测bbox参数的平方根来减轻尺度敏感性。（YOLO v1）

2)、使用log函数来减轻尺度的敏感性（R-CNN）

3)、L1-smooth loss 对于离群点更加温和（Fast R-CNN）

IoU作为衡量指标有两个优点：

1）、论文：Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记是一种数学定义上的距离，满足作为距离的一切性质（非负性，不可分辨性恒等式，对称性和三角不等式。）

2）、IoU与目标的尺度无关

mAP

mAP 两个平均分别是不同的（1）IoU阈值({.5, .55, · · · , .95}.)，以及不同的（2）类别

4、实验

（1）、使用GIoU替换原有的回归损失，效果都要好

（2）、Faster R-CNN and Mask R-CNN的提升没有YOLO v3的提升多，可能是a) 、前两个模型的anchor boxes比较多，因此GIoU在没有重叠区域的情况下的优势就体现不出来。