CV home

Computer vision paper notes

0%

论文 代码

提出了一个通用的特征提取和信息传递模块(i.e. AiA),一定程度上解决了attention机制中key和query单独匹配之后的correlation map中存在噪声和模糊权值的问题,进一步挖掘了Transformer tracker的潜力。在此基础上,作者设计的高效视频目标跟踪框架(AiATrack)在6个主流benchmark上均取得了SOTA的性能。

阅读全文 »

论文 代码

Transformer中自注意力的全局视角导致主要信息(如搜索区域中的目标)聚焦不足,而次要信息(如搜索区域中的背景)聚焦过度,使前景和背景的区分变得模糊,从而降低了跟踪性能。简单来说就是和每一个点计算注意力,导致背景部分占据了过大的权重,一定程度上削弱了目标。本文使用稀疏注意力缓解这一问题,来突出搜索区域中的潜在目标。

阅读全文 »