卷积神经网络笔记

一、卷积神经网络基础

        · 卷积神经网络(Convolutional Neural Network,简称CNN):在识别图片上面有着很好的应用。

       · CNN是一种空间上共享参数的神经网络,它通过正向和反向传播,自己学习识别物体。它可能有几层网络构成,第一层是抽象层次的最底层,CNN一般把图片中的较小的部分识别成简单的形状,下一层将会上升到更高的抽象层次,一般会识别更复杂的概念,以此类推,直至识别整个物体。

       · CNN的学习方式:

                  · 层次关系:简单的形状 → 复杂的物体 → 物体(例如狗)的整体

       · CNN网络结构组成:

                  · 图片要素的构成:一张32X32X3的图片意味着图片的长为32px,宽为32px,3代表这是一张RGB图片(即三通道图片:Red/Green/Blue),在这里也可以认为图片的深度。(补充:当深度为1的时候是单通道图片也就是我们常说的灰度图,每个像素点智能有一个值表示颜色,它的像素值在0-255之间,0是黑色,255是白色,中间值是一些不同等级的灰色。

          卷积神经网络笔记


二、一种典型的卷积神经网络结构

        · ’通常由输入层、卷积层、最大池化层、全连接层以及输出层构成。

       image→ convolution → max pooling → convolution → max pooling → fully connected → fully connected → classifier

        

       · 卷积层实际上就是将相邻的像素聚在一起,视作一个集合,CNN 要学习如何分类临近模式。

         它的第一步就是把图片切成小块,我们通过选取一个给定宽度和高度的滤波器来实现这一步。

         卷积神经网络笔记

          备注:每个patch连接多少神经元取决于滤波器的深度,如果深度是k,我们把每个patch与下一层的k个神经元相连。这样下一层的高度就是k。多个神经元的作用在于一个patch可以有多个意义的,可供提取的特点。一个给定的patch的分类,是由patch对应的权重和偏置项决定的。

         · 池化: 滤镜每次移动步幅较小的情况下,我们通过某种方法把相邻的所有卷积结合在一起。

            最大池化:在特征图的每一个点查看它周围很小范围的点,计算附近所有点的最大值。

                              使用最大池化的优点:不会增加参数数量(避免过拟合);

                                                                      提高模型的准确率;

                                                                      模型需要更多计算量;

                                                                      更多的超参需要调整(池区尺寸、池化步幅等)