DefInt:A Default-interventionist Framework for Efficient Reasoning with Hybrid Large Language Models

828 篇文章

已下架不支持订阅

DefInt框架借鉴人类认知的双重过程理论,利用小型LLM生成低成本推理,若需要更高精度,大型LLM进行干预。实验显示,DefInt在保持先进推理准确性和多样性的同时,显著降低49%~79%的token成本,特别是在开放式任务上降低75%。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《DefInt: A Default-interventionist Framework for Efficient Reasoning with
Hybrid Large Language Models》的翻译。

DefInt:一种用于混合大语言模型高效推理的默认干预主义框架

摘要

大型语言模型(LLM)在广泛的任务中表现出了令人印象深刻的涌现能力,但在处理复杂的推理问题时仍然面临挑战。以前的工作,如思想链(CoT)和思想树(ToT),主要侧重于提高准确性,但忽略了快速增加的token成本,这对于具有巨大解决方案空间的开放式现实世界任务来说可能特别有问题。受人类认知的双重过程理论的启发,我们提出了一个默认干预主义框架(DefInt)来释放混合LLM的协同潜力。默认情况下,DefInt使用较小规模的语言模型来生成低成本的推理思想,这类似于System 1产生的快速直觉。如果直觉被认为是低置信度的,DefInt将调用按比例放大的语言模型的反射推理作为系统2的干预,它可以覆盖默认思想并纠正推理过程。在五个具有代表性的推理任务上的实验表明,DefInt始终实现了最先进的推理准确性和解决方案的多样性。更重要的是,与第二个准确的基线相比,它大大降低了49%~79%的token成本。具体而言,开放式任务的token成本平均降低了75%。带有所有提示的代码库将在发布时公开。</

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值