论文阅读《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》

论文阅读《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》

论文链接:  https://arxiv.org/pdf/1911.12037.pdf

作者讲解:https://zhuanlan.zhihu.com/p/96999382


文章指出跟踪(tracking)问题和重识别(re-ID)问题存在一个本质区别:局部匹配vs全局匹配。跟踪系统只需匹配局部邻域(同一相机相邻帧/相邻相机)内的样本;而重识别系统需要全局(全部相机的所有数据)搜索、匹配。该区别导致在跟踪这一局部匹配问题上,直接应用全局学习到的重识别特征,并不能得到最好的结果[1]。面对这个区别/失配,文章提出了一套可学的,关注局部邻域内目标外观的度量(Locality Aware Appearance Metric) 

论文阅读《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》

 跟踪系统中的匹配一般被限制在局部邻域内;而应用于相似度估计的重识别特征,则是从全局学到的。相似度估计的结果直接决定数据匹配的性能。在这个关键部分,出现了局部vs全局的失配,则会对系统整体性能有很大影响。如下图所示,全局度量(global metric)一般利用模型的全部性能照顾各类外观变化。在局部邻域内,样本直接的区分一般较小(同相机连续帧/相邻相机之间,可能出现的外观变化有限;远远小于全部相机间的各种组合),全局模型由于能力有限,却不能有效区分相似样本(见下图A)。

论文阅读《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》

这篇文章提出了一种局部邻域内目标外观的度量。这种度量不需要照顾全局匹配中的各种外观变化;相反,它只需要照顾局部匹配中可能出现的几种外观变化,对于相似样本也更加有效。

特别的,对于单相机跟踪/多相机跟踪,文章分别提出了相机内(intra-camera)/相机间度量(inter-camera metric)。类似于跟踪系统为了限制匹配范围使用的时间滑动窗(temporal sliding window),文章也利用了相似的样本选择窗(data sampling window)训练相机内/相机间度量。

  • 相机内度量:通过样本选择窗,选择同相机相邻帧内的正负样本对。

论文阅读《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》