Large Language Models Hallucination: A Comprehensive Survey

该文章是一篇关于大型语言模型(LLMs)幻觉问题的综述,系统梳理了幻觉的定义、类型、成因、检测与缓解方法,同时分析了现有基准数据集、评估指标及未来挑战,为提升LLMs的真实性和可信度提供了全面参考。

一、文章主要内容总结

1. 幻觉的核心定义与类型
  • 定义:LLMs生成的文本流畅且语法正确,但事实不准确或缺乏外部证据支持的现象,会损害模型在医疗、法律等需事实准确性领域的可靠性。
  • 主要类型
    • 按与源信息关系分为内在幻觉(输出与源文档事实矛盾,如将《傲慢与偏见》作者错写为“查尔斯·狄更斯”)和外在幻觉(输出包含源文档中不存在的信息,如额外添加“简·奥斯汀1797年完成手稿”)。
    • 按内容属性分为事实幻觉(与真实世界事实偏离,含矛盾和编造)和忠实性幻觉(与输入指令、上下文或逻辑不一致,含指令偏离、上下文忽略、逻辑矛盾)。
2. 幻觉的成因分析(覆盖LLM全生命周期)
  • 数据收集阶段:训练数据存在偏见、重复、错误信息,或知识冲突、领域知识不足、信息过时、长尾知识缺失。
  • 模型架构阶段:注意力机制在长序列中聚焦分散、最大似然估计(MLE)目标函数不惩罚事实矛盾、位置
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值