图片大小、感受野、目标大小的关系

神经网络中感受野：神经网络每一层输出的特征图上的像素点在原始图像上映射区域的大小。

原始图像是指网络输入图像，是经过预处理后的图像。

图片大小、感受野、目标大小的关系

如图：

7×7的原始图像，第一次卷积Conv1的卷积核大小3，步长2；第二次卷积Conv2的卷积核大小为2，步长是1。

经过二次卷积后，图像变小，输出的特征图是2×2，很明显，原始图像的每个单元的感受野是1，Conv1的感受野是3。

而由于Conv2的每个单元都是由2×2范围的Conv1构成，因此，回溯到原始图像，每个单元能够看到5×5到校的区域范围。

因此，可以理解出：图像小（分辨率小，多次卷积后的特征图），感受野大，可以检测图像中较大的物体（我的理解是单元内如果有小物体，小物体更小不易检测到）