MOT算法、度量标准、数据集

1、算法

已经知道，MOT的算法按初始化方分为：DBT和DFT。其中DBT即基于检测的多目标追踪是最主流，最常用的办法。由于基于检测做跟踪，检测器的性能严重影响跟踪器的性能。

大部分的MOT算法的步骤为：

检测阶段（Detection）：分析输入帧，用边界框标识目标对象
特征提取或运动预测阶段（Feature extraction/motion prediction）：提取外观、运动或交互特征，运动预测可以预测被跟踪目标的下一个位置
亲和计算（Affinit）：特征和运动预测用于计算检测和轨迹的相似性或者距离
数据关联（Association）：相似性和距离度量用于关联属于同一个目标的检测和轨迹，为同一目标的检测分配相同的ID

MOTA的定义：
$MOTA = 1 - \frac{FN + FP + IDSW}{GT} \in (- \infty, 1)$
GT是真实边界框的数量。

MOTA的百分比：MOTP：
$MOTP = \frac{\sum_{t,i}d_{t,i}}{\sum_tc_t}$

$c_t$ 为第t帧匹配的次数， $d_{t,i}$ 为假设 $i$ 与其指定的ground truth对象之间的边界框重叠。值得注意的是，这个指标只考虑了很少的跟踪信息，而更关注于检测的质量。

二分图： $V_T,V_C$ .

$V_T$ ：对于每个真实轨迹都有一个所谓的规则节点，对于每个计算轨迹都有一个假阳性节点。

$V_C$ ：每个计算轨迹都有一个规则节点，每个真轨迹都有一个假阴性节点。

边的代价是为了在选择边的情况下计算假阴性帧和假阳性帧的数量。

于是有四种组合：

计算三个分数：

缩写	含义
IDTP	the sum of the weights of the edges selected as true positive ID matches
IDFP	the sum of weights from the selected false positive ID edges
IDFN	the sum of weights from the selected false negative ID edges

依据这三个分数又可以计算：

Identification precision: $IDP = \frac{IDTP}{IDTP + IDFP}$

Identification recall: $IDR = \frac{IDTP}{IDTP + IDFN}$

Identification F1: $IDF1=\frac{2}{\frac{1}{IDP} + \frac{1}{IDR}}=\frac{2IDTP}{2IDTP + IDFP + IDFN}$

FPS:跟踪器每秒处理的帧数。

MOT入门笔记（二）

MOTChallenge（MOT15、MOT16/17、MOT19），KITTI。

MOTChallenge专注行人跟踪，而KITTI允许追踪行人和车辆。

还有许多其他数据集，待日后完善。