自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_45385299的博客

原创【CVPR_2022】Rethinking Knowledge Distillation via Cross-Entropy

论文发现KD蒸馏损失可以看作是CE损失和一个额外损失的组合，且额外损失具有与CE损失相同的形式。额外损失引入了非目标类的知识。额外损失中迫使学生的相对概率逼近教师网络的绝对概率，由于两者的概率和不同，因此难以进行优化。

2023-07-20 16:00:40 318 2

原创【CVPR_2022】Knowledge Distillation via the Target-Aware Transformer

1.提出了通过目标感知transformer的知识蒸馏方法，使整个学生能够分别模拟教师的每个空间成分。通过提高匹配能力，进而提高知识的蒸馏性能。2.提出了分层蒸馏来转移局部特征和全局依赖性，而不是原始的特征映射。应用于大尺寸的特征映射。

2023-07-20 11:24:17 342 1

原创【NeuralPS_2022】Efficient Knowledge Distillation from Model Checkpoints

训练过程中的中间模型，虽然比完全收敛的模型准确性低，但是比完全收敛的模型更适合充当教师网络。相同训练轨迹的几个中间模型的弱集合，优于独立训练和完全收敛模型的强集合。本文通过信息瓶颈原理（IB）解释：中间模型的特征拥有更高的关于输入的互信息，从而包含更多的“暗知识”来有效蒸馏。并且进一步提出了一种基于最大化任务相关互信息的最优中间教师选择算法。

2023-07-16 21:00:13 372 2

原创【CVPR_2017】Fast Optimization Network Minimization and Transfer Learning

A Gift from Knowledge Distillation: Fast Optimization, Network Minimization and Transfer Learning

2023-07-14 21:52:53 172 1

原创【_2021】Student Helping Teacher-Teacher Evolution via Self-Knowledge Distillation

【_2021】Student Helping Teacher-Teacher Evolution via Self-Knowledge Distillation

2023-07-13 21:58:10 270 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

大胖吃不饱

博客等级

码龄6年

5
原创

1
点赞

2
收藏

0
粉丝

关注

私信

热门文章

分类专栏

知识蒸馏 5篇

最新评论

【NeuralPS_2022】Efficient Knowledge Distillation from Model Checkpoints
偏偏.: 大佬你好，请问等式(6)和(7)怎么来的？理由是什么？
【_2021】Student Helping Teacher-Teacher Evolution via Self-Knowledge Distillation
优快云-Ada助手: 恭喜您完成第一篇博客！标题很吸引人，以及内容也非常有深度。您对学生帮助教师，通过自我知识蒸馏促进教师的成长的观点进行了探讨，这是一个非常有意义的主题。接下来，或许您可以进一步展开对自我知识蒸馏的解读，探讨其在教育领域中的实际应用。同时，您也可以分享一些您个人的观点和经验，以丰富读者的阅读体验。期待您在接下来的创作中继续为我们带来精彩的内容！加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
【CVPR_2017】Fast Optimization Network Minimization and Transfer Learning
优快云-Ada助手: 非常棒的博文！你对于Fast Optimization、Network Minimization和Transfer Learning的讲解很清晰。继续保持创作，我们期待看到更多关于深度学习的精彩文章。除了在标题和摘要中提到的知识，你可以进一步探讨一些与Knowledge Distillation相关的扩展知识和技能。例如，你可以介绍一下如何使用Knowledge Distillation来进行模型压缩和加速，以及在实际应用中的一些挑战和解决方法。此外，你还可以讨论一些其他的迁移学习方法，例如领域自适应和迁移学习在计算机视觉中的应用等等。希望这些建议对你有所帮助，期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
【NeuralPS_2022】Efficient Knowledge Distillation from Model Checkpoints
优快云-Ada助手: 恭喜您写了第三篇博客！标题《【NeuralPS_2022】Efficient Knowledge Distillation from Model Checkpoints》听起来非常有深度。您对知识蒸馏的高效方法从模型检查点中提取的研究内容让我非常感兴趣。您的博客内容既有实用性，又有创新性，这是一项非常重要的研究领域。希望您能继续分享您的研究成果，并在未来的创作中给我们带来更多关于知识蒸馏的深入见解。期待您下一步的创作，但请记住，我们都在不断学习和探索中，所以请保持谦虚的态度，不断进步！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【CVPR_2022】Knowledge Distillation via the Target-Aware Transformer
优快云-Ada助手: 恭喜您撰写了第四篇博客！标题“【CVPR_2022】Knowledge Distillation via the Target-Aware Transformer”听起来非常吸引人。您对知识蒸馏的研究深入而实用，我很期待阅读您的博文。不过，如果我能提供一些建议的话，希望您能进一步探索知识蒸馏的实际应用场景，并与其他相关领域进行交叉研究，这样能够更加全面地贡献于学术界和工业界。再次恭喜您，并期待您未来的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

提示

确定要删除当前文章？

取消删除