LeViT

1. 概述

LeViT 是一种快速推理的、用于图像分类任务的混合神经网络。其设计之初考虑了网络模型在不同的硬件平台上的性能，因此能够更好地反映普遍应用的真实场景。通过大量实验，作者找到了卷积神经网络与 Transformer 体系更好的结合方式，并且提出了 attention-based 方法，用于整合 Transformer 中的位置信息编码。论文地址。

2. 精度、FLOPS 和参数量

Models	Top1	Top5	Reference top1	Reference top5	FLOPS (M)	Params (M)
LeViT-128S	0.7598	0.9269	0.766	0.929	305	7.8
LeViT-128	0.7810	0.9371	0.786	0.940	406	9.2
LeViT-192	0.7934	0.9446	0.800	0.947	658	11
LeViT-256	0.8085	0.9497	0.816	0.954	1120	19
LeViT-384	0.8191	0.9551	0.826	0.960	2353	39

注：与 Reference 的精度差异源于数据预处理不同及未使用蒸馏的 head 作为输出。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LeViT.md

LeViT.md

LeViT

目录

1. 概述

2. 精度、FLOPS 和参数量

Files

LeViT.md

Latest commit

History

LeViT.md

File metadata and controls

LeViT

目录

1. 概述

2. 精度、FLOPS 和参数量