Skip to content

Latest commit

 

History

History
27 lines (18 loc) · 1.16 KB

LeViT.md

File metadata and controls

27 lines (18 loc) · 1.16 KB

LeViT


目录

1. 概述

LeViT 是一种快速推理的、用于图像分类任务的混合神经网络。其设计之初考虑了网络模型在不同的硬件平台上的性能,因此能够更好地反映普遍应用的真实场景。通过大量实验,作者找到了卷积神经网络与 Transformer 体系更好的结合方式,并且提出了 attention-based 方法,用于整合 Transformer 中的位置信息编码。论文地址

2. 精度、FLOPS 和参数量

Models Top1 Top5 Reference
top1
Reference
top5
FLOPS
(M)
Params
(M)
LeViT-128S 0.7598 0.9269 0.766 0.929 305 7.8
LeViT-128 0.7810 0.9371 0.786 0.940 406 9.2
LeViT-192 0.7934 0.9446 0.800 0.947 658 11
LeViT-256 0.8085 0.9497 0.816 0.954 1120 19
LeViT-384 0.8191 0.9551 0.826 0.960 2353 39

:与 Reference 的精度差异源于数据预处理不同及未使用蒸馏的 head 作为输出。