DO LARGE LANGUAGE MODELS KNOW ABOUT FACTS?

最新推荐文章于 2025-11-24 18:29:32 发布

UnknownBody

最新推荐文章于 2025-11-24 18:29:32 发布

阅读量446

点赞数

CC 4.0 BY-SA版权

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/134251130

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

本文探讨了大型语言模型（LLM）在自然语言处理中的事实知识掌握情况。通过建立Pinocchio基准测试，研究发现尽管LLM在一些任务上有所进步，但它们仍存在事实知识不准确和虚假相关性的问题，这构成了实现可信人工智能的一大挑战。 Pinocchio数据集和代码已公开，以促进进一步的研究。

本文是LLM系列文章，针对《DO LARGE LANGUAGE MODELS KNOW ABOUT FACTS?》的翻译。
@TOC

摘要

大型语言模型（LLM）最近推动了一系列自然语言处理任务的显著性能改进。在预训练和指令调整过程中获得的事实知识可以用于各种下游任务，如问答和语言生成。与显式存储事实知识的传统知识库不同，LLM在其参数中隐式存储事实。LLM生成的内容往往会出现不准确或偏离事实的情况，因为事实可能会被错误地归纳或随着时间的推移而过时。为此，我们旨在通过设计基准Pinocchio来全面评估LLM中事实知识的程度和范围。Pinocchio包含了2万个不同的事实问题，这些问题跨越了不同的来源、时间线、领域、地区和语言。此外，我们研究LLM是否能够组成多个事实，在时间上更新事实知识，对多个事实进行推理，识别细微的事实差异，并抵制对抗性例子。对不同大小和类型的LLM进行的大量实验表明，现有的LLM仍然缺乏事实知识，并且存在各种虚假的相关性。我们认为这是实现值得信赖的人工智能的关键瓶颈。Pinocchio数据集和我们的代码将公开。

1 引言

2 数据集构建

3 方法

4 实验

5 相关工作

6 结论

在这项工作中，我们调查了LLM是否能够记忆事实知识并基于其进行推理，跨越各种问题类别和提示策略。为此，我们策划了Pinocc

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。