mtcnn理解三------边框的回归

https://blog.****.net/zijin0802034/article/details/77685438

如下图所示：

mtcnn理解三------边框的回归

对于上图，绿色的框表示Ground Truth(就是人工标注的准确的飞机区域), 红色的框为我们的训练网络预测的飞机区域。那么即便红色的框被我们的网络分类器识别为飞机，但是由于红色的框定位不准(IoU<0.5)，那么这张图相当于没有正确的检测出飞机。如果我们能对红色的框进行微调，使得经过微调后的窗口跟准确窗口区域Ground Truth 更接近，这样定位会更准确。确实，Bounding-box regression 就是用来微调这个窗口的。

边框回归是什么？

对于窗口box一般使用四维向量(x,y,w,h)来表示，分别表示窗口的中心点坐标和宽高。对于图 2, 红色的框 P 代表网络初步预测的box, 绿色的框 G 代表目标的真实box区域 Ground Truth，我们的目标是寻找一种关系(或称为映射,或称为网络), 网络的预测输出box 窗口 P 跟真实窗口 G 更接近.

mtcnn理解三------边框的回归