DeiT详解：知识蒸馏的Transformer

最新推荐文章于 2025-04-23 17:34:29 发布

sjx_alo

最新推荐文章于 2025-04-23 17:34:29 发布

阅读量2.2k

点赞数 2

分类专栏：机器视觉深度学习文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_36758270/article/details/130976455

版权

深度学习同时被 2 个专栏收录

110 篇文章 ¥199.90 ¥299.90

订阅专栏

超级会员免费看

57 篇文章

订阅专栏

DeiT是Facebook与索邦大学合作提出的一种利用知识蒸馏技术优化Transformer模型的方法，旨在解决ViT模型训练数据需求大、运算速度慢的问题。通过知识蒸馏，DeiT模型能在仅使用ImageNet数据的情况下，达到与先进CNN相当的性能，且训练更快。论文介绍了知识蒸馏的背景、理论原理，并展示了DeiT如何在Transformer中应用知识蒸馏。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DeiT详解：知识蒸馏的Transformer

0. 引言
1. ViT
2. DeiT
3. 总结

0. 引言

针对 ViT 需求数据量大、运算速度慢的问题，Facebook 与索邦大学 Matthieu Cord 教授合作发表 Training data-efficient image transformers（DeiT） & distillation through attention。DeiT 将知识蒸馏的策略与 ViT 相结合，性能与最先进的卷积神经网络（CNN）可以抗衡。

论文名称：Training data-efficient image transformers & distillation through attention
论文地址：https://arxiv.org/abs/2012.12877
代码地址：https://github.com/facebookresearch/deit

1. ViT

提到 DeiT ，就不提不提及 ViT 。这里

了解本专栏

超级会员免费看

博客等级

码龄9年

人工智能领域优质创作者

博客专家认证

188
原创

1943
点赞

2294
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 【CVPR2022】CSWin Transformer详解

下一篇：: MAE(Masked Autoencoders) 详解

最新评论

EEG+EMG学习系列 (1) :一个基于小波的自动睡眠评分模型
sjx_alo: 没有源码链接说明作者没公开源码。数据集的话你要看论文里面是不是公开数据集。如果不是的话就没有。
EEG+EMG学习系列 (1) :一个基于小波的自动睡眠评分模型
Icant_: 有源码和数据集吗
运动想象 (MI) 迁移学习系列 (15) : 基于Wasserstein距离的改进域适应网络
sjx_alo: 首先，要说这篇文章是基于EEG数据设计的一种模型，而不是单纯的提出一种新的模型。模型要基于EEG数据进行更加具体的设计，这也是文章的点。其次，对于ADDA模型和本模型相比，两者的整体思路大致是一致的（当然，所有GAN模型的本质差不多都是一致的）。至于，涉及具体源域和目标域的计算方式还是存在区别的。最后，关于WGAN模型和本文中的模型相比，还是模型在具体应用的区别。看关于目标函数的设计，近似是一致的。至于具体的EEG数据的应用的话，还是有区别的。起码，别的关于EEG数据的模型没有这么用的。
运动想象 (MI) 迁移学习系列 (15) : 基于Wasserstein距离的改进域适应网络
m0_48336876: 和Adversarial Discriminative Domain Adaptation（ADDA）这个有差别吗？WGAN就是基于Wasserstein的，不是已经提出了吗？
脑机接口：运动想象简介
幼儿园的高财生: 嗯嗯好，谢谢您

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

sjx_alo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。