CV home

Computer vision paper notes

0%

Transform 在视觉领域遍地开花,终于目标跟踪也没能逃过。并行的长距离依赖(空间和时间皆可)对于目标跟踪似乎有着天然的优势,本篇笔记简要概述今年 CVPR2021 关于 Transform 在目标跟踪中的应用,主要介绍动机和结构,细节和实验部分以后有空再补充。

阅读全文 »

论文

Motivation

当跟踪目标外观发生变化时,需要对模型进行更新。使用传统的 SGD、岭回归这些更新方法耗时且容易过拟合,因此本文提出用元学习 (meta-learning) 方式对模型进行更新。本文方法的 motivation 如图 1 所示,分为匹配网络和元学习网络。前者是标准的孪生网络,元学习网络接收来自匹配网络的元信息,并为匹配网络提供自适应的 target-specific 特征空间。而元学习网络仅需一次前向传播就可以得到 target-specific 特征空间的参数,实时性较好,达到了 48fps。

阅读全文 »

从 SiamRPN 将跟踪问题定义为 one-shot detection 任务之后,出现了大量将检测组件由于跟踪的研究。不过 Siamese 系列一个很大的问题在于其本质仍然是一个模板匹配问题,网络关注的是寻找与 target 相似的东西,而忽视了区分 target 和 distractor 的判别能力,这正是目标检测任务所擅长的。目标检测和目标跟踪的关键差异在于检测是一个 class-level 的任务,而跟踪是一个 instance-level 的任务(即检测只关注类间差异而不重视类内差异,跟踪需要关注每一个实例,同时跟踪的类别是不可知的)。

本篇笔记关注如何将目标检测框架应用在跟踪中,主要介绍其思想,细节部分不做过多描述,记录论文包含:

阅读全文 »

Siam R-CNN 是亚琛工业大学 & 牛津大学联合推出的,核心是通过重检测进行视觉跟踪,并构建了基于轨迹的动态规划算法,建模被跟踪对象和潜在干扰对象的完整历史。效率方面,该方法可以在 ResNet-101 上达到 4.7 FPS,在 ResNet-50 上达到 15 FPS 。

阅读全文 »