Rule or Story, Which is a Better Commonsense Expression for Talking with Large Language Models?

本文探讨了大型语言模型(LLM)在处理常识时,使用故事还是规则表达的效果。研究表明,故事在检索和利用常识时优于规则,特别是在日常事件问题上,而规则在科学问题上更有效。通过迭代自监督微调,可以提升故事的正确性和相关性,揭示了利用LLM常识能力的新方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Rule or Story, Which is a Better Commonsense Expression for Talking with Large Language Models?》的翻译。

摘要

由于常识规则的报告偏见和基于规则的常识推理的暴露偏见,构建具有常识的机器一直是NLP中的一个长期挑战。相比之下,人类通过故事含蓄地传达和传递常识。本文研究了通过讲故事表达的大型语言模型(LLM)固有的常识能力。我们系统地调查和比较了LLM中检索和利用常识的故事和规则。在28个常识性QA数据集上的实验结果表明,故事作为从LLM中检索常识的表达式优于规则,表现出更高的生成置信度和常识准确性。此外,故事是回答日常事件问题的更有效的常识表达,而规则对科学问题更有效。这与文本语料库中常识性的报道偏见是一致的。我们进一步证明,通过迭代自监督微调,可以进一步提高常识故事的正确性和相关性。这些发现强调了使用适当的语言来表达、检索和利用LLM常识的重要性,突出了更好地利用其常识能力的有希望的方向。

1 引言

2 背景

3 LLM的常识检索作为故事和规则

4 利用故事和规则中的常识解决问题

5 迭代自监督微调

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值