基于卷积神经网络的图像分类算法综述
论文百度网盘下载链接,提取码6666
关键词:卷积神经网络,图像分类,对抗式生成网络,胶囊网络
0.论文摘要
说明了本论文干了下面几件事:
- 介绍了图像分类问题,卷积神经网络,给出了截至2018年12月份,所采用的主流算法以及其发展历史
- 分析了主流算法的特点,训练过程中遇到的问题以及解决办法
- 介绍了对抗式生成网络和胶囊网络
1.引言
说明了了下传统机器学习办法有K-最邻近算法,支持向量机等。这些算法原理是一些对图像特征(纹理,颜色,形状等)的分类算法,原理简单,效果良好,但在一些复杂分类问题(差异很小,干扰严重)上表现很差。这时候我们需要深度学习,卷积神经网络来解决问题。最后吹了一波深度学习多么多么好。
2.卷积神经网络
这部分内容对超小白来说不友好,首先要理解基本的全连接神经网络是什么?我查了****上,觉得这篇写的不错的,不懂的可以先去理解全连接神经网络
相比全连接神经网络,卷积神经网络加入了卷积操作和池化操作,相应地加入了卷积层和池化层。
卷积操作
池化操作
如果只看论文,懂的还是懂,不懂的还是不懂。所以我又找了两篇不错的博客。
3.1常用的数据集介绍
- MNIST手写数据集.
- CIFAR-10.
- CIFAR-100.(相比CIFAR-10分成了100类)
- Image-NET.
- Fashion-Mnist.(我自己加的)
3.2经典的卷积神经网络模型
- LeNet模型:诞生于1994,最早的卷积神经网络之一,开山鼻祖。
- AlexNet模型:2012年ILSVRC大赛冠军网络,准确率大大甩开了第二名,引爆了深度学习热潮。
- GoogLeNet模型:2014年ILSVRC大赛冠军网络,特点是引入了Inception模块。
- VGG模型:2014年ILSVRC大赛亚军网络,与冠军网络相差无几。特点是:①使用了多个小卷积核代替大卷积核,大大减少了运算,加大了模型深度。②提出了随机截取的方法进行了数据增强。
- ResNet模型:2015年ILSVRC大赛冠军网络,特点是提出了residual结构
-
SENet模型:2017年ILSVRC大赛冠军网络,特点是提出了SE模块。
3.3卷积神经网络模型训练注意事项与技巧
3.4生成式对抗神经网络和胶囊网络
- 生成式对抗神经网络(Generative adversarial nets,GAN):由生成器网络和判别器网络两部分构成。生成器网络用于生成假图片,判别器网络用于分辨该图片是真是假。该网络一定程度解决了需要大量标记样本的问题,完成了半监督学习。
- 胶囊网络(Capsules network):定义了胶囊网络,解决了cnn对空间关系辨识度差的问题。
4.实验比较
①对比了CNN(卷积神经网络),MLP(全连接神经网络),KNN(K-最邻近算法)
②对比经典卷积神经网络训练中的损失值
③对比经典卷积神经网络训练的速度
④经典卷积神经网络在cifar-10上错误率对比
⑤生成式对抗神经网络和胶囊网络在MNIST上准确率
5.结论
革命尚未成功,同志还须努力。