Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

很久没有写博客了,这一周的时间可以讲几乎一半都在琢磨思考这篇文章,特别是里面参杂着条件随机场就更加的难以思量了,所以花费了很久到现在才算大概清楚了,这里呢,对这篇文章的学习过程做一个简单的记录,方便自己review也提供给后来者参考。

1)首先是关于这个里面涉及的条件随机场,我觉得没有接触过的同学不需要把他当成一个预备知识尝试先去了解一下,因为这是一个特别大,特别大,特别大的坑(我进坑了,到这会儿还没完全趟出来,他会浪费你大量作为初学者的时间)。文章中涉及条件随机场的内容,你只需要把他当成普通的数学知识去理解就好,讲的还是听清楚的。看完之后你会发现,哦,这就是条件随机场。既然都废话这么多了,我尝试用一句话来描述下条件随机场。

条件随机场是一个判别式的模型,它主要作用就是根据输入的数据x直接判断y。这是一个模型,然后依据相应的方法主要可以解决这样的问题,模型的训练,概率的预测。它的特点就是扩充了隐藏层与展示层以及与前一层之间的关系,并且可以自定义特征方程。

2)那这篇文章的优势在哪里?

在传统的文章里面,无论是通过特征图还是特征向量来进行相似度对比或者距离计算,都是在原图或者特征图像素-像素这个基础上进行的,即使经过池化层,特征图缩略,对比的也只是局部的信息,对于整个全局的相似性并没有充分的考虑进去,所以在这篇文章里面在训练过程中通过CRF学习局部特征与整体特征之间的关系。然后在测试过程中还采用多层特征结合的方法进一步挖掘语义信息。所以多级特征提取加上局部整体特征结合,大大提高了整个模型的性能。

3)什么是局部相似度?什么是全局相似度?

如下图所示,我们假定由一个probe图像以及一个图片集g,他们共同属于图片集O,对比图片集g两个两个之间的存在一个相似度,probe图像与图片集g之间也存在一个相似度,这部分关系统称局部相似度,整体相似度的定义是,P与g任两个图片之间的相似度与那两个图片之间的相似度之间也存在的关系,他们的集合称为整体相似度。这是我唯一能够理顺的理解。

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

4)通过CRF对group consistency建模

给定一个图片集O,我们首先估算出所有的局部相似性T。同时我们计算了多层的局部相似性,表示如下:Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记,s表示局部相似性对应的层数。同时Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

关于O中任意两张图片之间相似性的定义可以描述如下:

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

其中Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记通过图片的特征图之间的计算求出两张图片之间的相似度。

我们对于probe图片以及目标集之间的全局相似度的计算描绘出随机变量,形成了Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记,Y与T之间的关系可以描述为连续的CRF分布,可以用一个Gibbs分布来表示:

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

E被称为势函数,对于全连接的二元CRF函数,可以表示为:‘

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

以上是对于全局相似性的定义,那么这个全局相似性y如何求得呢?

我们利用Q(Y)来近似P(Y/T),Q(Y)可以描述成单独的Q(yi)的乘积的联合分布,所以最优的Q表示可以表示为:

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

然后通过推理我们可以得到:

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

然后通过这个可以观察出,Qy是服从高斯分布的,在导数等于零的地方取得最大值,也就是我们希望的最优解。强调一下这是个比较关键的部分,然后可以求得y的表达式:

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

这部分的推导可能有的朋友不是很理解,一个个敲太麻烦了,这是我笔记,我把它拍了传上来了。

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

5)基于CRF的深度模型

整个框架可以分为三个部分,特征提取部分,局部相似度模型,集体相似度模型

Group Consistent Similarity Learning via Deep CRF for Person Re-Identification学习笔记

这里就大同小异了,相信能把上面看完的同学,对于这部分的理解是可以达到的。