目标跟踪综述:《Machine Learning Methods for Solving Assignment Problems in Multi-Target Tracking》
文章目录
引言
多目标跟踪的主要任务是给定一个图像序列,找到图像序列中运动的物体,并将不同帧的物体一一对应,给出不同物体的运动轨迹。应用场景包括行人检测,交通监控,自动驾驶等。
多目标跟踪问题在关键在于数据关联(data association)和轨迹间关联问题(track-to-track association)。数据关联指的是对一组新检测结果与已存在目标轨迹进行匹配。当有多个传感器时,需要处理轨迹间关联问题。我们需要对来自不同传感器的相同目标进行匹配。
问题表达
2.1 Linear Assignment
问题描述:在时刻有个已知轨迹(track)和个检测结果(detection, measurement)其中。假设有一个矩阵,元素表示在时刻将第个measurement与第个track进行匹配的成本。用二元变量表示是否分配。问题的目标是找到最优匹配使总成本最小。
with constraints
约束条件说明measurement与track间只能唯一匹配。
最常用的算法是Hungarian (匈牙利算法),复杂度为。对于目标跟踪问题,LA只考虑前一时刻的measurement数据关联,优点是速度快,可实现实时跟踪算法,问题是对于堵塞,误检,漏检等情况表现不行。一个可行的方法是设置时间上的滑动窗口,关联时延时决策,使用多个时刻的measurement信息。问题变换为下面要说明的问题。
2.2 Multidimensional Assignment
问题描述: 为时间窗口,为不同时刻的measurements组成的集合,目标是找到一个该集合的划分使总成本最小。
:时刻mesurements总个数
:不同时刻的measurements串成一条轨迹的成本
:相应二元决策变量
注意:其它论文中从0开始,为0时说明选择的measurement为假。因为个个时刻的measurement个数可能不等。
说明一下第一个约束等式,等式中不变,指第1个时刻时的任意measurement都只与一个track匹配。其它约束等式相同。
2.3 Assignment Costs
计算Cost 矩阵
2.3.1 Kinematic Costs
基于概率计算cost
串成真轨迹和假轨迹概率之比。检测的measurement不一定为真,存在一个真假的概率分布,分子是measurement为真且串成轨迹的概率,分母是假轨迹概率。
:第k个时刻目标状态的measurement为的概率
:第j个轨迹k时刻的状态为的概率。
优化
由于该问题为NP-Hard问题,我们需要设计算法近似求解最优值。
3.1 最大权重独立集问题
独立集指图顶点的一个子集,满足任意两点间没有边连接,两个问题等价,不过要将cost转换为track score。证明可查阅《The Maximum Weight Independent Set Problem for Data Association in Multiple》。
说明四个时刻分别将1时刻第0个measurement,2时刻第0个measurement。。。串成一个轨迹,与第4个轨迹后两个选择冲突,也与6最后一个冲突。
3.2 贪婪随机搜索
参考论文《Multiple object video tracking using GRASP-MHT》。
3.2.1 TOMHT Framework
记k时的measurements为为扫描次数或滑动窗口大小,为k时第个measurement,记为可能的漏检。一个track hypothesis 轨迹假设由一组mesurements组成:
如果track 与measuremetn关联,则轨迹得分 track score 的增量为
则的track sorce 为增量总和:
当两个track不共享正确检测则它们互相兼容。一个全局假设global hypothesis 为互相兼容的track组成的集合。则假设的score为其中包含的所有tracks scores之和:
在枚举所有个假设后,特定假设发生概率为:
track 的概率为:
计算复杂度太高:
Gate 方法,只考虑满足不等式的measurement
为先验预测,为的协方差。
3.2.2 GRASP for the Hypothesis Enumeration
在有限次数计算内找出次优解,计算最大权重独立集问题。
搜索算法
每次计算构造一个可行解,再本地搜索返回一个更优解。
可行解的构造
将图顶点按贪心策略排序:greedy function
为与相邻的点和自己本身组成的集合,每次贪心选点时维护一个候选列表condidate list 满足条件:
为剩余点的greed function最大值。在初始化选点是,先排序
选择一对不相连且greedy function 值之和最大的顶点对,初始化后从候选列表中随机抽取一个顶点。
本地搜索
无向图的最大团=该补图的最大独立集
3.3 网络流方法
参考论文《Global Data Association for Multi-Object Tracking Using Network Flows》,《Multi-target Tracking by Lagrangian Relaxation to Min-Cost Network Flow》