CV home

Computer vision paper notes

0%

Transform在视觉领域遍地开花,终于目标跟踪也没能逃过。并行的长距离依赖(空间和时间皆可)对于目标跟踪似乎有着天然的优势,本篇笔记简要概述今年CVPR2021关于Transform在目标跟踪中的应用,主要介绍动机和结构,细节和实验部分以后有空再补充。

阅读全文 »

论文

Motivation

当跟踪目标外观发生变化时,需要对模型进行更新。使用传统的SGD、岭回归这些更新方法耗时且容易过拟合,因此本文提出用元学习(meta-learning)方式对模型进行更新。本文方法的motivation如图1所示,分为匹配网络和元学习网络。前者是标准的孪生网络,元学习网络接收来自匹配网络的元信息,并为匹配网络提供自适应的target-specific特征空间。而元学习网络仅需一次前向传播就可以得到target-specific特征空间的参数,实时性较好,达到了48fps。

阅读全文 »

从SiamRPN将跟踪问题定义为one-shot detection任务之后,出现了大量将检测组件由于跟踪的研究。不过Siamese系列一个很大的问题在于其本质仍然是一个模板匹配问题,网络关注的是寻找与target相似的东西,而忽视了区分target和distractor的判别能力,这正是目标检测任务所擅长的。目标检测和目标跟踪的关键差异在于检测是一个class-level的任务,而跟踪是一个instance-level的任务(即检测只关注类间差异而不重视类内差异,跟踪需要关注每一个实例,同时跟踪的类别是不可知的)。

本篇笔记关注如何将目标检测框架应用在跟踪中,主要介绍其思想,细节部分不做过多描述,记录论文包含:

阅读全文 »

Siam R-CNN是亚琛工业大学&牛津大学联合推出的,核心是通过重检测进行视觉跟踪,并构建了基于轨迹的动态规划算法,建模被跟踪对象和潜在干扰对象的完整历史。效率方面,该方法可以在 ResNet-101 上达到 4.7 FPS,在 ResNet-50 上达到 15 FPS 。

阅读全文 »