卷积神经网络笔记

一、卷积神经网络基础

· 卷积神经网络（Convolutional Neural Network，简称CNN）：在识别图片上面有着很好的应用。

· CNN是一种空间上共享参数的神经网络，它通过正向和反向传播，自己学习识别物体。它可能有几层网络构成，第一层是抽象层次的最底层，CNN一般把图片中的较小的部分识别成简单的形状，下一层将会上升到更高的抽象层次，一般会识别更复杂的概念，以此类推，直至识别整个物体。

· CNN的学习方式：

· 层次关系：简单的形状 → 复杂的物体 → 物体（例如狗）的整体

· CNN网络结构组成：

· 图片要素的构成：一张32X32X3的图片意味着图片的长为32px，宽为32px，3代表这是一张RGB图片（即三通道图片：Red/Green/Blue），在这里也可以认为图片的深度。（补充：当深度为1的时候是单通道图片也就是我们常说的灰度图，每个像素点智能有一个值表示颜色，它的像素值在0-255之间，0是黑色，255是白色，中间值是一些不同等级的灰色。）

卷积神经网络笔记

二、一种典型的卷积神经网络结构

· ’通常由输入层、卷积层、最大池化层、全连接层以及输出层构成。

image→ convolution → max pooling → convolution → max pooling → fully connected → fully connected → classifier

· 卷积层实际上就是将相邻的像素聚在一起，视作一个集合，CNN 要学习如何分类临近模式。

它的第一步就是把图片切成小块，我们通过选取一个给定宽度和高度的滤波器来实现这一步。

卷积神经网络笔记

备注：每个patch连接多少神经元取决于滤波器的深度，如果深度是k，我们把每个patch与下一层的k个神经元相连。这样下一层的高度就是k。多个神经元的作用在于一个patch可以有多个意义的，可供提取的特点。一个给定的patch的分类，是由patch对应的权重和偏置项决定的。

· 池化：滤镜每次移动步幅较小的情况下，我们通过某种方法把相邻的所有卷积结合在一起。

最大池化：在特征图的每一个点查看它周围很小范围的点，计算附近所有点的最大值。

使用最大池化的优点：不会增加参数数量（避免过拟合）；

提高模型的准确率；

模型需要更多计算量；

更多的超参需要调整（池区尺寸、池化步幅等）

卷积神经网络笔记

相关推荐