[深度学习入门]知识蒸馏

最新推荐文章于 2025-03-12 09:09:00 发布

Guycynnnnn

最新推荐文章于 2025-03-12 09:09:00 发布

阅读量2.8k

点赞数 3

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Guycynnnnn/article/details/126557625

版权

本文介绍了知识蒸馏的概念，该技术通过教师网络的soft targets指导学生网络学习，保留了类间相似度信息。知识蒸馏有助于模型轻量化，并使用温度T调整softmax输出的概率分布。损失函数包括学生网络与教师网络之间的蒸馏损失和学生网络与真实标签的softmax损失。文中提供了相关论文查找资源及代码参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：Distilling the Knowledge in a Neural Network

相关论文查找网站：

1. Connected Papers | Find and explore academic papers

2. https://paperswithcode.com/

3. 知识蒸馏在做什么？

将soft targets的结果作为标签进行训练stduent model，增加了更多的信息（物体间的相似度）：

知识蒸馏主要是将大模型轻量化，以教师网络的输出（即通过数据集学到的各类检测物间的概率，概率中包含类与类间的隐式关系，即各类物体间的相似程度）作为学生网络的输入，以供学生网络学习轻量化模型。

4. 如何蒸馏？

通过温度T进行蒸馏（T用来将各类物体间的相似度进行放大或缩小）：

当T=1时，pi就是标准的softmax；随着T的增加，softmax函数的概率分布函数就会变得更加平缓，也就是将各类之间的相似度拉得趋近于相同，如下图所示：

5. 损失函数：

最低0.47元/天解锁文章

博客等级

码龄4年

13
原创

9
点赞

71
收藏

5
粉丝

关注

私信

热门文章

分类专栏

最新评论

[Xavier]编译不通过问题
liyangzhong7: 什么叫下面？说了等于没说啊。不是每个系统都有且仅有一个1024 数字。即使有，也不知道是不是同一个参数。
Semantic-Kitti数据解析
Guycynnnnn: 其实挺简单的，你先读入你的文件，调用WriteFile把label那一列单独保存就好，.label文件里面就是对应的点云的类别。
[论文系列]SegNeXt
Guycynnnnn: 完整代码和论文放在目录下面了
[论文系列]SegNeXt
蓝风铃zj: 您好，请问这个第二部分有完整代码吗？感谢
[深度学习入门]Yolo系列
Guycynnnnn: 可以看我最后发的那个课程链接，是百度的课，用的paddle框架，了解一个框架之后其他框架触类旁通会容易很多

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。