卷积神经网络笔记(一些基本概念和模块)
卷积神经网络笔记(北京大学tensorflow人工智能实战)
若图片用全连接网络来建立模型,由于参数过多,会造成过拟合,因此先进行特征提取,再通过全连接网络来建立模型。
基本概念
感受野(Receptive Field):卷积神经网络各输出特征图中的每个像素点,在原始输入图片上映射区域的大小。
例如:一个5*5的矩阵,用一个3*3的矩阵来提取特征,得到一个3*3的矩阵,则它的感受野为3
一个5*5的矩阵,用一个5*5的矩阵来提取特征,得到一个1*1的矩阵,则它的感受野为5
主要模块
全0填充:目的是为了保证卷积计算中输出特征图上的尺寸不变。
TF描述全零填充:用参数padding= 'SAME' 输出特征图片尺寸 = 入长/步长(向上取整)
或padding=‘VALID’表示。 输出特征图片尺寸 = (入长-核长+1)/步长(向上取整)
例如:一个5*5的矩阵,步长为1,核长为3*3,用全零填充 ,输出特征图片尺寸为5/1 = 5,即为5*5的图片
若不采用全零填充,则输出特征图片尺寸为(5-3+1)/1=3,即为3*3的图片。
TensorFlow描述卷积计算层:
批标准化(BN )Batch Normalization(使得输入数据位于**函数的线性区域附近,更具有区分度。其位于卷积层之后,**层之前。)
标准化:使数据符合0均值,1为标准差的分布
批标准化:对一小批数据(batch),做标准化处理。
为了同时满足数据的非线性表达力,引入缩放因子和偏移量。
池化(pooling)
池化用于减少特征数据量。最大池化可提取图片纹理,均值池化可保留背景特征。
舍弃(dropout):为了缓解神经网络的过拟合