MAML-Tracker --CVPR2020,目标跟踪方向论文翻译

论文地址:https://arxiv.org/pdf/2004.00830.pdf

基于实例检测的跟踪:元学习方法

Abstract

我们认为跟踪问题是一种特殊类型的对象检测问题,我们称之为实例检测。
有了适当的初始化,检测器就可以通过从单个图像学习新实例而快速转换为跟踪器。我们发现(model-agnostic )模型无关元学习(MAML)提供了一种初始化检测器以满足我们需求的策略。我们提出了一个有原则的三步方法来构建一个高性能的跟踪器。首先,选择任何受过梯度下降训练的现代物体探测器。第二,使用MAML进行离线培训(或初始化)。第三,使用初始帧进行域适配。我们按照这个过程构建了两个跟踪器,名为RetinaMAML和FCOS- maml,基于两个现代的检测器RetinaNet和FCOS。对四个基准的评估表明,这两种追踪工具与最先进的追踪工具相比都具有竞争力。在OTB-100上,Retina-MAML获得了最高的AUC 0.712。在TrackingNet上,FCOS-MAML在leader board上排名第一,AUC为0.757,归一化精度为0.822。这两个追踪器都以每秒40帧的速度实时运行。

1. Introduction

给定一个在初始帧中定义目标对象的边界框,视觉对象跟踪的目标是自动确定目标在随后的每一帧中的位置和范围。跟踪问题与检测问题密切相关甚至可以看作是一种特殊类型的对象检测,我们称之为实例检测。主要的区别是,对象检测定位一些预定义类的对象,其输出不区分类内实例。但是对象跟踪只查找特定的实例,它可能属于任何在初始帧中指定的已知或未知对象类MAML-Tracker --CVPR2020,目标跟踪方向论文翻译
图注:MAML提供了一种初始化实例检测器的有效方法。通过单个训练图像,检测器可以快速适应新的领域(实例)。它能够在后续帧中定位目标对象,即使对象有明显的外观变化。

由于这两个任务之间的相似性,一些目标检测技术在目标跟踪中得到了广泛的应用。例如,在faster R-CNN检测器[31]中提出的区域建议网络(RPN)已经被SiamRPN跟踪器及其变体所采用[22,21,45]。多宽比锚的引入解决了一直困扰着以前的跟踪器的盒估计问题。它极大地提高了基于暹罗网络的跟踪器的性能。最近,IoU网络[14]被ATOM和DiMP应用于对象跟踪[6,3],再次成为对象检测领域的创新,并展示了强大的功能。除了这些方法借用先进的组件从对象检测装配跟踪器,我们认为另一个选择是直接将现代的对象检测器转换成高性能的跟踪器。这将允许跟踪器不仅保留先进的组件,而且还保留基本探测器的整体设计。主要的挑战是如何获得检测器的良好初始化,以便一旦给出一个新实例,它就可以有效地将实例信息注入到网络中而不会过度拟合。图1说明了这个想法。该检测器在自适应之前可以像一般的对象检测器一样工作。但对单一训练图像进行域适应后,能够“记忆”目标,并在后续帧中正确定位目标。Huang等人最近的一项工作与我们有类似的观点,但他们仍然将跟踪视为一个两步任务,即类级对象检测和实例级分类。在第一个子任务中,涉及到一个模板映像,并使用一个单独的分支来处理模板。