应用于素描人脸识别的迁移学习

论文————Composite Sketch Recognition via Deep Network - A Transfer Learning Approach
2015年
论文中使用了由稀疏栈自编码器(stacked sparse antoencoder )和深度置信网络(Deep Belief Network)结合的网络,采用layer by layer unsupervised training的训练方法更新权重。非监督训练提取特征,监督训练计算matching score 。具体步骤如下:
首先,由于稀疏栈自编码器本身对噪声具有较强的鲁棒性,深度置信网络本身有较强的学习表征的能力,故而将两者连接起来,组成一个新的深度学习网络,用来提取脸部的一般特征。
自编码器
应用于素描人脸识别的迁移学习如上图所示,自编码器就是通过一个隐藏层得到特征向量后,将其解码,与原输入特征进行对比,更新权重。而栈自编码器则是有多个隐藏层,且每一个隐藏层的输入都是前面的一层,训练方式是逐层训练。最终得到一个良好的特征。

深度置信网络(DBN)
DBN由多个RBM((限制玻尔兹曼机)组成。RBM跟AE(自编码器)很相似。
相似点在于:参数都由权重、偏置项构成;都可以reconstruct,使得输入和重构之间的差异性最小。
不相似的点在于:AE所用的训练方法是BP算法,其loss函数是距离函数,其输入层和最终的输出层是一样的,即维度一致。目的是为了使得输出和输入越来越相近。
RBM的隐藏层产生一个概率,其loss值是使得通过概率生成的新的数据与原始概率的分布误差越来越小。
其训练方法是CD-k,loss函数是能量函数。他的特征提取出来会更丰富。他只有两层,但AE可以有多层。

算法步骤:
1、归一化:彩色图变为灰度图,将人脸对齐,归一化到同一尺寸
2、先使用CMU Multi-PIE数据集做预训练,得到一个初始模型,之后输入图片素描对,对参数进行微调,得到更新后的模型,之后分别通过模型对图片和素描进行特征提取,将得到的图片和素描特征串联起来,输入到后面的神经网络分类器中,训练一个分类器。之后用该分类器求取测试集的matching score
提取特征的算法图:
应用于素描人脸识别的迁移学习
整个算法步骤图示如下:
应用于素描人脸识别的迁移学习
最终的实验结果如下:
应用于素描人脸识别的迁移学习
补充:
svm分类器和神经网络分类器的区别:线性SVM分类器和神经网络分类器相似,但非线性SVM分类器和神经网络分类器相差较大,在此并不细说。
参考博客:
RBM
http://baijiahao.baidu.com/s?id=1599798281463567369&wfr=spider&for=pc
逐层贪婪预训练
https://blog.****.net/jningwei/article/details/78836823
深度置信网络
https://blog.****.net/kellyroslyn/article/details/82668733
https://blog.****.net/u013714645/article/details/74892888
AE
https://blog.****.net/zb123455445/article/details/78924074
AE和RBM的区别
https://blog.****.net/wtq1993/article/details/51510370