在507干活的第4天(下)
进入深度学习这一章节。
下午状态有些差,可能是因为晚上睡得少有关。睡一觉以后就好了(笑)
知识点1:总览卷积神经网络
卷积神经网络是一种深度学习神经网络。其拥有2个隐层。
它有三个非常重要的概念
局部感受野(local receptive fields),共享权重(shared weights),和混合(pooling)。
他们如下图一般组织在一起。
其中最后一层是混合层每一个神经元对输出层每一个神经元的全连接。此处简化了。
知识点2:局部感受野
其实就是遥感里面的一个视窗,和计算SSIM的方法类似。
将图像中开一个n*n的窗口,然后将整个窗口映射到下一层中。
这个输入图像的小窗口称为隐藏神经元(下图右边的那个神经元)的局部感受野。
知识点2:共享权重
对于隐层的所有神经元,我们都使用相同的n*n权值矩阵和偏置,这样做的目的是为了大幅度减少参数量。
对第j,k个隐藏神经元输出的数学公式如下
这样做以后,可以看出第一个隐层就是用来检测某种相同的特征。而且能够很好地适应图像的平移不变性(但是这部分我没太看懂,翻译出来的话太过绕口,待找出原文理解)
另外,我们把输入层到隐层的映射称为一个“特征映射”。定义特征的权值称为“共享权值”,偏置称为“共享偏置”。共享的偏置和权值称为一个“卷积核”或者“滤波器”
为了识别图像,我们需要多个特征映射(比如下图的3个)
知识点3:混合层
混合层一般在卷基层的后面,它也是一个隐层。
她的作用是简化卷基层的信息。
工作原理如下图:
将卷基层中2*2窗口的信息映射到混合层。映射的规则有两种,第一种是取最大**值,称为“最大值混合”第二种是取**值平方和的平方根,称为“L2混合”。