卷积神经网络

这篇文章解释地特别简单易懂:
How do Convolutional Neural Networks work?
译文:图解CNN:通过100张图一步步理解CNN

CNN的目的:
理想的情况下,我们希望,对于那些仅仅只是做了一些像平移,缩放,旋转,微变形等简单变换的图像,计算机仍然能够识别出图中的”X”和”O”。就像下面这些情况,我们希望计算机依然能够很快并且很准的识别出来:
卷积神经网络
这也就是CNN出现所要解决的问题。

卷积操作:
卷积神经网络

池化:
卷积神经网络

因为最大池化(max-pooling)保留了每一个小块内的最大值,所以它相当于保留了这一块最佳的匹配结果(因为值越接近1表示匹配越好)。这也就意味着它不会具体关注窗口内到底是哪一个地方匹配了,而只关注是不是有某个地方匹配上了。这也就能够看出,CNN能够发现图像中是否具有某种特征,而不用在意到底在哪里具有这种特征。这也就能够帮助解决之前提到的计算机逐一像素匹配的死板做法。

卷积神经网络