IOU等深度学习名词定义

一.IOU(Intersection over Union) -交并比

IOU是一种测量在特定数据集中检测相应物体准确度的一个标准。在PASCAL VOC challenge中经常使用该标准。

一般在 HOG + Linear SVM object detectors 和 Convolutional Neural Network detectors (R-CNN, Faster R-CNN, YOLO, etc.)中使用该方法检测其性能。
注意 :这个测量方法和你在任务中使用的物体检测算法没有关系。

IOU是一个简单的测量标准,只要是在输出中得出一个预测范围(bounding boxex)的任务都可以用IOU来进行测量。为了可以使IOU用于测量任意大小形状的物体检测,我们需要:
1、 ground-truth bounding boxes(人为在训练集图像中标出要检测物体的大概范围,也就是人为对数据进行标注的框,这个就要考研数据标注人员的能力了)。
ps:博主也进行过相当长一段时间的标注工作。

2、我们的算法得出的结果范围(算法计算出来的结果)。


也就是说,这个标准用于测量真实和预测之间的相关度,相关度越高,该值越高(可以理解为:算法计算的输出框与人为标注的方框的重合程度,程度程度越高,IOU越大,输出结果越准确)。

举例,如下图所示:
IOU等深度学习名词定义
上图展示了ground-truthpredicted的结果,绿色标线是人为标记的正确结果,红色标线是算法预测出来的结果,IOU要做的就是在这两个结果中测量算法的准确度。公式如下图所示:
IOU等深度学习名词定义
如上图所示,IOU相当于两个区域重叠的部分除以两个区域的集合部分得出的结果(IOU=两个区域交集 / 两个区域并集)。
一般来说,这个score > 0.5 就可以被认为一个不错的结果了。

测试结果:
IOU等深度学习名词定义


二.NMS(non maximum suppression)-非极大值抑制

NMS即非极大抑制,顾名思义就是抑制不是极大值的元素,搜索局部的极大值。

在物体检测中,NMS 应用十分广泛,其目的是为了清除多余的框,找到最佳的物体检测的位置。


三.RPN(RegionProposal Network)-区域生成网络

1.anchors(锚点)定义。

为方便理解,下面以图像数据(二维)进行举例:

特征可以看做一个尺度51*39256通道图像,对于该图像的每一个位置,考虑9个可能的候选窗口,候选框选择依据:
三种面积 {128,256,512} ×三种比例 {1:1,1:2,2:1},这些候选窗口称为anchors
51*39anchor中心,以及9anchor示例。
IOU等深度学习名词定义
2.Sofmax(**函数)
IOU等深度学习名词定义
计算每个像素256-d9个尺度下的值,得到9anchor,我们给每个anchor分配一个二进制的标签(前景背景)。我们分配正标签前景给两类anchor
1) 与某个 ground truth(GT) 包围盒有最高的 IoU重叠的anchor(也许不到0.7)。
2) 与任意GT包围盒有大于0.7IoU交叠的anchor
注意到一个GT包围盒可能分配正标签给多个anchor。我们分配负标签(背景)给与所有GT包围盒的IoU比率都低于0.3anchor。非正非负的anchor对训练目标没有任何作用,由此输出维度为 (2*9=18),一共18维。

假设在conv5 feature map中每个点上有kanchor(默认k=9),而每个anchor要分foregroundbackground,所以每个点由256d feature转化为cls=2k scores;而每个anchor都有 [x, y, w, h] 对应4个偏移量,所以reg=4k coordinates

补充: 全部anchors拿去训练太多了,训练程序会在合适的anchors中随机选取 128个postive anchors+128个negative anchors进行训练。

具体关于RPN和faster-RPN:https://blog.csdn.net/qq_36269513/article/details/80421990