LLM之幻觉（二）：大语言模型LLM幻觉缓减技术综述

wshzd

于 2024-01-15 17:26:56 发布

阅读量761

点赞数 7

分类专栏：笔记 ChatGPT 幻觉文章标签：语言模型人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wshzd/article/details/135606786

版权

笔记同时被 3 个专栏收录

202 篇文章

订阅专栏

81 篇文章

订阅专栏

1 篇文章

订阅专栏

本文概述了LLM幻觉缓减技术，分为梯度方法（如微调和知识图谱）和非梯度方法（如RAG和Prompt工程）。强调了综合使用多种方法预防幻觉，包括无监督学习、知识注入和结构化推理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

LLM幻觉缓减技术分为两大主流，梯度方法和非梯度方法。梯度方法是指对基本LLM进行微调；而非梯度方法主要是在推理时使用Prompt工程技术。LLM幻觉缓减技术，如下图所示：

LLM幻觉缓减技术值得注意的是：

检索增强生成（RAG）
知识检索（https://arxiv.org/abs/2307.03987）
CoNLI（https://arxiv.org/abs/2310.03951）
CoVe（https://cobusgreyling.medium.com/chain-of-verification-reduces-hallucination-in-llms-20af5ea67672）

与专注于有限任务的传统人工智能系统不同，LLM在训练过程中使用了大量的在线文本数据。当大模型语言生成功能应用在要求严格的应用程序时，LLM幻觉就变得非常令人担忧，例如：

总结医疗记录；
客户支持对话;
财务分析报告，并提供错误的法律建议。

一、幻觉缓解分类法

这项研究对LLM幻觉缓解技术进行了总结，分类为：梯度方法和非梯度方法。

梯度方法包括复杂和不透明的解码策略、知识图谱、微调策略等。

非梯度方法包括RAG、自我优化和Prompt微调。

值得注意的是，RAG方法分为四个部分；

生成之前；
生成期间；
生成后；
端到端

Prompt工程缓解幻觉的原理在于定义：

特殊上下文&；
预期输出

二、最佳预防幻觉

预防幻觉的最佳方法不是单一的方法，需要综合多种方法。

缓减幻觉需要考虑以下因素：

在多大程度上依赖标签数据？
引入无监督或弱监督学习技术以提高可扩展性和灵活性的可能性是什么？
考虑梯度和非梯度方法，以产生连贯和上下文相关的信息。
收集到的缓解幻觉的工作揭示了一系列不同的策略，每种策略都有助于解决LLM中幻觉的细微差别。
通过反馈和推理的自我完善会产生有影响力的策略。
结构化比较推理引入了一种结构化的文本偏好预测方法，增强了连贯性，减少了幻觉。
监督微调可以通过知识注入和师生方法进行探索。
特定领域的知识被注入到较弱的LLM和使用反事实数据集来提高真实性的方法中。

参考文献：

[1] https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wshzd 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。