目标检测——RCNN之建议框padding

在学习RCNN的过程中,一直搞不明白resize 227*227这个步骤之前的context padding(建议框padding)这个步骤是怎么进行的,因为发现原论文中最后得到的resize图片(下图 a中红框)跟我所理解得到的resize图片不太相符,

目标检测——RCNN之建议框padding

                                                                                      图 a 

我所理解的padding后的图片,应该是上下左右都等距地扩大16个像素值,但是从图a中红框可以看出原文并没有进行等距地扩大16个像素,所以百思不得其解,在google各种问题,查看各种网址,最终在源代码中找到了答案,分别查看:

1. rcnn_create_model.m

2.rcnn_extract_regions.m

3.rcnn_im_crop.m

这3个文件发现:虽然文中说是padding 16个像素值,但是却是在保持长宽比的基础上进行padding,也就是说如果一幅影像的长宽比不是1:1的话,那么建议框的扩大也不是按照1:1进行。

对于文中出现的各向同性变形以及各向异性变形,可以参考这篇文章:

https://www.jianshu.com/p/3a0a0e5a26a1 

终于可以睡觉了~各位早安,晚安~