模型蒸馏过程中的“软目标”与“温度”

1. 概念阐释:

想象一下,你是个小孩子(小模型),想学画画。你的老师(大模型)是个世界级画家,他画了一幅非常复杂的画。传统上,你只被教“画完后,这幅画是猫还是狗”(硬目标)。

但知识蒸馏不一样。老师会告诉你:“这块区域,虽然看起来像猫的胡须,但如果仔细看,它也有一点点像狗的耳朵,还有非常非常微弱的一点点像树叶。” 老师不仅告诉你“是什么”,还会告诉你“有多像其他东西”。这种细致的“感觉”就是 “软目标”

“温度”,就像老师在告诉你这些细微感觉时,会稍微 “放慢语速,说得更清楚一点”。让这些本来很小的“像不像”变得更容易被你这个小孩子(小模型)听懂和模仿。

在Hinton的原始论文中,知识蒸馏的核心思想是:让“学生模型”不只学习“正确答案”本身,更要学习“老师模型”在给出“正确答案”时,对“其他答案”的“倾向性判断”

我们来具体拆解一下:

  • “硬目标”: 这就是我们通常训练模型时用的“正确答案”。比如,一张图片里是“猫”,那它的硬目标就是“猫”(100%是猫,0%是狗,0%是鸟)。模型的目标就是学着把“猫”预测为“猫”。

  • “软目标”(Soft Targets): 老师模型在判断一张图片是“猫”的时候,它的内部计算结果可能不是简单的“猫就是猫”。它可能会说:“这张图片有99.9%的可能是猫,但也有0.09%的可能是小狗,还有0.01%的可能

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

由数入道

滴水助江海,心灯渡万世。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值