Memvit: Memory-augmented multiscale vision transformer for efficient long-term video recognition

作者： Chao-Yuan Wu , Yanghao Li , Karttikeya Mangalam , Haoqi Fan , Bo Xiong

DOI:

关键词:

摘要: … The techniques presented in this paper are general and applicable to other transformer-based video models. We hope MeMViT will be useful for future long-term video modeling …

thecvf.com 本地加速

thecvf.com PDF 下载加速

参考文章(0)

Memvit: Memory-augmented multiscale vision transformer for efficient long-term video recognition

来源期刊

我的账户

Memvit: Memory-augmented multiscale vision transformer for efficient long-term video recognition

来源期刊

相似文章 0

我的账户