"Computer Vision"

[Reading] Training data-efficient image transformers & distillation through attention

DeiT 論文を読んだのでそのメモ。 多くの ViT 研究において、 DeiT の学習スキームがフォローされている。 最近読んだ ShiftViT1 において言及されており、ちゃんと読んでおこうと思っていた。 書誌情報 @misc{touvron2021training, title={Training data-efficient image transformers & distillation through attention}, author={Hugo Touvron and Matthieu Cord and Matthijs Douze