行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification

摘要

行人再识别问题一般有两种解决思路,一种是对单张图像的特征进行匹配(SIR, single-image represention),另一种是对交叉图像特征进行二分类处理(CIR,cross-image representation)。在本文中,我们对两种方式之间的联系进行了探索,并借助CNN提出了一种联合两种方式的学习框架。

对于上述的两种方式,第一种是通过比较两张图像特征之间的距离与阈值之间的大小关系来判断两张图像是否属于同一个人。在第二种方式中,当获取到交叉图像的特征后,图像的匹配问题可以被看作是一个二分类问题。在SIR中,由于可以提前提取所有图像的特征因此具有比较高的效率,而CIR相比SIR而言在发掘图像之间的关联性方面显得更胜一筹。因此,本文希望将两种方式有效的结合起来,以充分发挥两种方法各自的优势。

损失函数

尽管作者用一定的篇幅分析了SIR和CIR之间的关系,但是在实际应用中也只是将两者损失进行了加和。

Pairwise Comparison

行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification

其中:

行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification

行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification

Triplet 损失也同样采用了类似的手段。

图像距离

将欧式距离和CIR的距离相加得到:

行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification

 网络结构

行人再识别:Joint Learning of Single-image and Cross-image Representations for Person Re-identification