计算机视觉-02 卷积(学习笔记)

资源:
https://zhuanlan.zhihu.com/p/30994790
详细:
https://blog.****.net/zouxy09/article/details/49080029

卷积公式:
计算机视觉-02 卷积(学习笔记)
物理意义大概可以理解为:系统某一时刻的输出是由多个输入共同作用(叠加)的结果。
f(x) 可以理解为原始像素点(source pixel),所有的原始像素点叠加起来,就是原始图了。
g(x)可以称为作用点,所有作用点合起来我们称为卷积核(Convolution kernel)。
卷积核上所有作用点依次作用于原始像素点后(即乘起来),线性叠加的输出结果,即是最终卷积的输出,也是我们想要的结果,我们称为destination pixel.
计算机视觉-02 卷积(学习笔记)
最左边呢就是我们原始输入图像了,中间呢是卷积层,-8就是卷积的结果。

图像的锐化和边缘检测很像,我们先检测边缘,然后把边缘叠加到原来的边缘上,原本图像边缘的值如同被加强了一般,亮度没有变化,但是更加锐利。(与卷积的数学意义很像)
对于一维函数f(x),其一阶微分的基本定义是差值:
计算机视觉-02 卷积(学习笔记)
我们将二阶微分定义成如下差分:
计算机视觉-02 卷积(学习笔记)
我们首先我们来看边缘的灰度分布图以及将一二阶微分作用于边缘上:
计算机视觉-02 卷积(学习笔记)
可以看到,在边缘(也就是台阶处),二阶微分值非常大,其他地方值比较小或者接近0 .
那我们就会得到一个结论,微分算子的响应程度与图像在用算子操作的这一点的突变程度成正比,这样,图像微分增强边缘和其他突变(如噪声),而削弱灰度变化缓慢的区域
也就是说,微分算子(尤其是二阶微分),对边缘图像非常敏感。

各向同性的滤波器:各向同性滤波器是旋转不变的,即将原图像旋转之后进行滤波处理,与先对图像滤波再旋转的结果应该是相同的。
最简单的各向同性微分算子是
拉普拉斯算子

一个二维图像函数f(x,y)的拉普拉斯算子定义为
计算机视觉-02 卷积(学习笔记)
那么对于一个二维图像f(x,y),我们用如下方法去找到这个拉普拉斯算子:
计算机视觉-02 卷积(学习笔记)
这个结果看起来太复杂,我们能不能用别的方式重新表达一下,如果我们以x,y 为坐标轴中心点,来重新表达这个算子,就可以是:
计算机视觉-02 卷积(学习笔记)
由于拉普拉斯是一种微分算子,因此其应用强调的是图像中的灰度突变。将原图像和拉普拉斯图像叠加在一起,从而得到锐化后的结果。

于是模板就变为计算机视觉-02 卷积(学习笔记)
注:如果所使用的模板定义有负的中心系数,那么必须将原图像减去经拉普拉斯变换后的图像,而不是加上他。
上面这个,就是一个锐化卷积核模板了。原始边缘与它卷积,得到的就是强化了的边缘(destination pixel),图像变得更加锐利。

结论:
(1)原始图像通过与卷积核的数学运算,可以提取出图像的某些指定特征(features)。
(2)不同卷积核,提取的特征也是不一样的。
(3)提取的特征一样,不同的卷积核,效果也不一样。

CNN实际上也就是一个不断提取特征,进行特征选择,然后进行分类的过程,卷积在CNN里,就是充当前排步兵,首先对原始图像进行特征提取。