CNN图像通道数和卷积核的大小及数量的关系

CNN图像通道数和卷积核的大小及数量的关系

对于一张56×56×3的图片来说,3代表的就是输入图像的通道数,也可以理解为3张56×56的特征图,例如对一幅彩色图像来说,就代表R、G、B三颜色通道的特征图。因此对其进行卷积运算时,卷积核的深度就必须与输入图像的通道数相同,拿1×1卷积来说,卷积核的大小就必须是1×1×3。
CNN图像通道数和卷积核的大小及数量的关系
上面的1×1×3中的3是进行卷积运算时的卷积核的大小,我初学时总是会将其和卷积核的数量相混淆,认为所谓1×1卷积的降维的作用就是通过这个参数来体现,因此专门在这里总结一下。实际上,当1×1×3卷积核的数量只有1个时,最终得到的输出图像的通道数为1。

因此,控制输出图像通道数的是卷积核的数量,即1×1×3卷积核的数量,如下图所示。
CNN图像通道数和卷积核的大小及数量的关系
【CNN】理解卷积神经网络中的通道 channel