Transform 与目标跟踪
Transform 在视觉领域遍地开花,终于目标跟踪也没能逃过。并行的长距离依赖(空间和时间皆可)对于目标跟踪似乎有着天然的优势,本篇笔记简要概述今年 CVPR2021 关于 Transform 在目标跟踪中的应用,主要介绍动机和结构,细节和实验部分以后有空再补充。
Transform 在视觉领域遍地开花,终于目标跟踪也没能逃过。并行的长距离依赖(空间和时间皆可)对于目标跟踪似乎有着天然的优势,本篇笔记简要概述今年 CVPR2021 关于 Transform 在目标跟踪中的应用,主要介绍动机和结构,细节和实验部分以后有空再补充。
Anchor-free + 孪生网络做跟踪在 2020 年非常火爆,相关笔记在 b 站记录。本文主要对其整合进行简单归纳。
从 SiamRPN 将跟踪问题定义为 one-shot detection 任务之后,出现了大量将检测组件由于跟踪的研究。不过 Siamese 系列一个很大的问题在于其本质仍然是一个模板匹配问题,网络关注的是寻找与 target 相似的东西,而忽视了区分 target 和 distractor 的判别能力,这正是目标检测任务所擅长的。目标检测和目标跟踪的关键差异在于检测是一个 class-level 的任务,而跟踪是一个 instance-level 的任务(即检测只关注类间差异而不重视类内差异,跟踪需要关注每一个实例,同时跟踪的类别是不可知的)。
本篇笔记关注如何将目标检测框架应用在跟踪中,主要介绍其思想,细节部分不做过多描述,记录论文包含:
Siam R-CNN 是亚琛工业大学 & 牛津大学联合推出的,核心是通过重检测进行视觉跟踪,并构建了基于轨迹的动态规划算法,建模被跟踪对象和潜在干扰对象的完整历史。效率方面,该方法可以在 ResNet-101 上达到 4.7 FPS,在 ResNet-50 上达到 15 FPS 。