文章目录

1.NIN 结构
2.MLP卷积
3.全局均值池化
4.总体网络架构
5.NIN补充

5.1 广义线性模型（GLM）的局限性
5.2 CCCP层
5.3 1*1卷积核作用（补充）

6.手势识别RGB图像--NIN结构

经典CNN中的卷积层就是用线性滤波器对图像进行内积运算，在每个局部输出后面跟着一个非线性的**函数，最终得到的叫作特征图。
这种卷积滤波器是一种广义线性模型。所以用CNN进行特征提取时，其实就隐含地假设了特征是线性可分的，可实际问题往往不是线性可分的。
GLM的抽象能力比较弱，比线性模型更有表达能力的非线性函数近似器（比如MLP,径向基神经）

5.2 CCCP层

MLPconv=CONV + MLP，因为conv是线性的，mlp是非线性的，mlp能够得到更高的抽象，泛化能力更强。

跨通道时，mlpconv=卷积层 + 1×1卷积层，此时mlpconv层也叫cccp层
深度学习（06）-- Network in Network（NIN）

5.3 1*1卷积核作用（补充）

深度学习（06）-- Network in Network（NIN）

6.手势识别RGB图像–NIN结构

深度学习（06）-- Network in Network（NIN）
收敛缓慢，且震荡
加了一层softmax ，第一三块后加了BatchNormalization，基本解决了

代码实现：

def NIN(input_shape=(64,64,3), classes=6):

    X_input = Input(input_shape)

    "block 1"
    X = Conv2D(filters=4, kernel_size=(5,5), strides=(1,1), padding='valid', activation='relu', name='conv1')(X_input)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=4, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp1')(X)
    X = Conv2D(filters=4, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp2')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='maxpool1')(X)

    "block 2"
    X = Conv2D(filters=8, kernel_size=(3,3), strides=(1,1), padding='valid', activation='relu', name='conv2')(X)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=8, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp3')(X)
    X = Conv2D(filters=8, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp4')(X)
    X = AveragePooling2D((2,2), strides=(2,2), name='maxpool2')(X)

    "block 3"
    X = Conv2D(filters=16, kernel_size=(3,3), strides=(1,1), padding='valid', activation='relu', name='conv3')(X)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=16, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp5')(X)
    X = Conv2D(filters=16, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp6')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='maxpool3')(X)

    "block 4"
    X = Conv2D(filters=6, kernel_size=(3,3), strides=(1,1), padding='same',  activation='relu', name='conv4')(X)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=6, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp7')(X)
    X = Conv2D(filters=6, kernel_size=(1,1), strides=(1,1), padding='valid', activation='relu', name='cccp8')(X)
    X = AveragePooling2D((6,6), strides=(1,1), name='Avepool1')(X)

    "flatten"
    X = Flatten()(X)
    X = Dense(classes, activation='softmax', name='fc1')(X)

    model = Model(inputs=X_input, outputs=X, name='NIN')

    return model

深度学习（06）-- Network in Network（NIN）

文章目录

目录

1.NIN 结构

2.MLP卷积

3.全局均值池化

4.总体网络架构

5.NIN补充

5.1 广义线性模型（GLM）的局限性

5.2 CCCP层

5.3 1*1卷积核作用（补充）

6.手势识别RGB图像–NIN结构

相关推荐