【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations

行人数据的特征空间分布在highly-curved manifold,很难用geodesic距离比较2个样本。manifold学习方法常采用局部范围内的欧式距离结合样本间的图形关系来近似geodesic距离。文章主要通过moderate positive mining和对马氏距离的权重限制来提高速度和性能。

Moderate positive mining

  • 数据有很大的类内差异
  • 数据在特征空间中分布十分不规则
    【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
    这导致很难用geodesic距离来比较2个样本,通常采用马氏距离,这在理想条件下是合适的度量方法。另一方面,manifold学习建议采用局部范围内的欧式距离结合图形关系来近似geodesic距离。这是一个可行的方法来最小化监督学习中manifold上类内差异。然而,采用contrastive或triplet loss的CNN来得到embedding,已经存在的用欧式距离的方法没有对所有的positive样本都具有判别力。文章认为在局部范围内选择positive样本很重要(上图中的黄色),选择具有很大距离的positive样本可能会扭曲manifold和损害manifold学习。
    本文采用的基本思想为:通过在局部范围内mining moderate positive pairs来减小类内差异的同时保留数据本质上的图形结构。
    方法为:对于一个相机中的id在另一个相机中选择相同数量的positive和negative,组成batch,提取特征后计算马氏距离,对于所有小于最小negative中选择最大距离的positive
    【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
    【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations

Weight Constraint

【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
比起马氏距离,欧式距离有更若的判别性和更强的泛化性,因为它没有考虑尺度和维度之间的相关性,文章通过增加限制使M的对角元素较大,其余元素较小来平衡2种距离的优劣。
【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
λ较小时,马氏距离考虑了维度相关性,容易过拟合,当λ过大时,距离度量接近于欧式距离,欧式距离未考虑相关性,但是会提高泛化性能,通过调节λ来得到最好的结果。
【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
128*64的图片被分成3段overlapping的64*64,3个branch 权值不共享 ,分别有3个CNN+2个pooling+1个FC+Relu+FC+Norm,接下来是度量学习。CNN和度量层的参数是通过BP同步学习的。
【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations
【2016_ECCV】Embedding Deep Metric for Person Re-identification: A Study Against Large Variations