MUSCLE:Apple研发,解决了模型每次更新后出现的结果不一致问题

自2021年ChatGPT发布以来,几个科技公司似乎都参与了AI的浪潮中,但是如今(2024)世界市值排名第2的Apple却一直“隐身”,直到WWDC24开完,世人才发现原来Apple也一直在AI领域发力。最近,Apple又研发出了一个解决模型更新后结果不一致情况的解决方案,名为MUSCLE。

目前模型的问题

在2023到2024年AI大模型大爆发以来,模型一直在不断的更新当中,但每次更新后可能因为一些原因,导致更新后的模型输出的结果跟以前的模型不一样的情况,被迫使用户为了得到相同的答案而适应新的模型版本,苹果的MUSCLE就是为了解决这个问题而产生的。

该策略的核心是通过训练一个兼容性适配器,使模型在更新后能够尽量保持与旧版本模型的兼容性,从而减少预测结果的不一致性,特别是减少所谓的“负翻转”现象。

什么是“负翻转”

论文(PDF):2407.09435 (arxiv.org)

根据提供的PDF文档内容,"负翻转"(Negative Flips)是指在更新大型语言模型(LLMs)时出现的一种现象,即原本由旧模型正确预测或生成的实例,在新模型上变成了错误的预测或生成。这种现象对于用户来说可能会导致困惑和不满意,因为他们需要不断地适应新的模型行为。

负翻转的具体含义

  • 定义:负翻转是指之前正确预测或生成的实例,在模型更新后变成了错误的预测或生成。

  • 影响:这可能导致用户对模型的信任度下降,尤其是当用户已经对旧模型的行为有了心理预期时。

  • 观察:研究发现,当旧模型和新模型之间的性能差距较小时,负翻转会更加明显。例如,在对话总结等生成任务中,连续评估指标(如ROUGE分数)对小的变化更加敏感,因此更容易观察到大量的负翻转。</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CodeMicheal

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值