应用于素描人脸识别的迁移学习

论文————Composite Sketch Recognition via Deep Network - A Transfer Learning Approach
2015年
论文中使用了由稀疏栈自编码器（stacked sparse antoencoder ）和深度置信网络（Deep Belief Network）结合的网络，采用layer by layer unsupervised training的训练方法更新权重。非监督训练提取特征，监督训练计算matching score 。具体步骤如下：
首先，由于稀疏栈自编码器本身对噪声具有较强的鲁棒性，深度置信网络本身有较强的学习表征的能力，故而将两者连接起来，组成一个新的深度学习网络，用来提取脸部的一般特征。
自编码器
应用于素描人脸识别的迁移学习如上图所示，自编码器就是通过一个隐藏层得到特征向量后，将其解码，与原输入特征进行对比，更新权重。而栈自编码器则是有多个隐藏层，且每一个隐藏层的输入都是前面的一层，训练方式是逐层训练。最终得到一个良好的特征。

深度置信网络（DBN）
DBN由多个RBM(（限制玻尔兹曼机）组成。RBM跟AE（自编码器）很相似。
相似点在于：参数都由权重、偏置项构成；都可以reconstruct，使得输入和重构之间的差异性最小。
不相似的点在于：AE所用的训练方法是BP算法，其loss函数是距离函数，其输入层和最终的输出层是一样的，即维度一致。目的是为了使得输出和输入越来越相近。
RBM的隐藏层产生一个概率，其loss值是使得通过概率生成的新的数据与原始概率的分布误差越来越小。
其训练方法是CD-k，loss函数是能量函数。他的特征提取出来会更丰富。他只有两层，但AE可以有多层。

算法步骤：
1、归一化：彩色图变为灰度图，将人脸对齐，归一化到同一尺寸
2、先使用CMU Multi-PIE数据集做预训练，得到一个初始模型，之后输入图片素描对，对参数进行微调，得到更新后的模型，之后分别通过模型对图片和素描进行特征提取，将得到的图片和素描特征串联起来，输入到后面的神经网络分类器中，训练一个分类器。之后用该分类器求取测试集的matching score
提取特征的算法图：
应用于素描人脸识别的迁移学习
整个算法步骤图示如下：

最终的实验结果如下：

补充：
svm分类器和神经网络分类器的区别：线性SVM分类器和神经网络分类器相似，但非线性SVM分类器和神经网络分类器相差较大，在此并不细说。
参考博客：
RBM
http://baijiahao.baidu.com/s?id=1599798281463567369&wfr=spider&for=pc
逐层贪婪预训练
https://blog.****.net/jningwei/article/details/78836823
深度置信网络
https://blog.****.net/kellyroslyn/article/details/82668733
https://blog.****.net/u013714645/article/details/74892888
AE
https://blog.****.net/zb123455445/article/details/78924074
AE和RBM的区别
https://blog.****.net/wtq1993/article/details/51510370

应用于素描人脸识别的迁移学习

相关推荐