RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING

Yuerya.

已于 2024-03-23 09:48:49 修改

阅读量831

点赞数 3

分类专栏： paper 文章标签：深度学习人工智能

于 2024-03-22 15:54:16 首次发布

本文链接：https://blog.youkuaiyun.com/m0_62032391/article/details/136938072

版权

现有方法：
1.对于语言模型预训练进行昂贵的特定检索修改

2.使用了对数据存储器的事后集成，从而导致了次优的性能

改进： RA-DIT：检测增强双指令调优(两部分微调) 对任意LLM加入检索功能

两个微调步骤：
1.更新预训练语言模型，更好地利用检索信息

2.更新检索器，返回更相关的信息

模型：LLaMA+DRAGON+

根据语言模型的prompt进行检索，产生检索块，每个检索块放在prompt前，来自多个块的预测被并行计算并集成以产生最终输出。

指令微调步骤：
1.LM-ft：采用了监督学习的 fine-tuning 方法来训练模型，并在每个 fine-tuning prompt 前加入了一个从外部检索到的“background”字段。

2.检索微调（R-ft）：采用了一种名为“generalized LM-Supervised Retrieval (LSR)” 的训练目标来更新查询编码器，该目标结合了监督学习和无监督学习的思想，并计算在监督任务和无监督文本补全任务的组合上

语言模型：LLaMA

检索器：基于双编码器的检索器架构

给定语料库c和查询q进行点积计算：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Yuerya.

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

从传统RAG到Graph RAG：知识图谱技术驱动下的链路转型与融合策略[DB-GPT、OpenSPG、Tugraph三合一]

丨汀、的博客

09-10

807

从传统RAG到Graph RAG：知识图谱技术驱动下的链路转型与融合策略

Vector | Graph：蚂蚁首个开源Graph RAG框架设计解读

南七小僧的学海无涯

08-09

870

RAG的目标是通过知识库增强内容生成的质量，通常做法是将检索出来的文档作为提示词的上下文，一并提供给大模型让其生成更可靠的答案。更进一步地，RAG的整体链路还可以与提示词工程（Prompt Engineering）、模型微调（Fine Tuning）、知识图谱（Knowledge Graph）等技术结合，构成更广义的RAG问答链路。增强训练REALM引入了知识检索器增强大模型预训练，以改进大模型的问答质量和可解释性。增强微调RA-DIT实现了对大模型和检索器的双指令微调，RAFT。

参与评论您还未登录，请先登录后发表或查看评论

[论文笔记]RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING

日积月累，天道酬勤

10-18

1234

⭐ 作者提出了一种检索增强微调的方法，为语言模型和检索器进行微调。引导LLM最佳地利用检索到的信息并忽略干扰内容。

RAG相关内容介绍

m0_52695557的博客

11-11

1072

LLM的训练数据集是固定的,一旦训练完成就很难再通过继续训练来更新其知识。LLM的参数量巨大,随时进行fine-tuning需要消耗大量的资源，并且需要相当长的时间。LLM的知识是编码在数百亿个参数中的,无法直接查询或编辑其中的知识图谱。因此,LLM的知识具有静态、封闭和有限的特点。为了赋予LLM持续学习和获取新知识的能力,RAG应运而生。提示：以下是本篇文章正文内容，下面案例可供参考。

太强了！最全的大模型检索增强生成（RAG）技术概览！

机器学习社区

03-10

7593

如果你已经熟悉检索增强生成（Retrieval Augmented Generation, RAG）的概念，请直接跳转到高级 RAG 部分。检索增强生成（Retrieval Augmented Generation, RAG）是一种技术，它通过从数据源中检索信息来辅助大语言模型（Large Language Model, LLM）生成答案。

LLM之RAG理论（三）| 高级RAG技术全面汇总

wshzd的博客

12-27

3058

让我们看一看多文档代理方案（https://docs.llamaindex.ai/en/stable/examples/agent/multi_document_agents.html）——一个非常复杂的设置，包括在每个文档上初始化一个代理（OpenAIAgent（https://docs.llamaindex.ai/en/stable/examples/agent/openai_agent.html）），能够进行文档摘要和经典的QA机制，以及一个顶级代理，负责将查询路由到文档代理并进行最终答案合成。

一文读懂：大模型RAG（检索增强生成）

最新发布

weixin_38252409的博客

05-09

959

本文提出了一种名为CoRAG（链式检索增强生成）的训练方法，用于提升RAG模型在复杂查询任务中的表现。与传统RAG仅进行单次检索不同，CoRAG通过动态调整查询并逐步检索推理，实现信息的迭代获取。为训练该模型，研究者采用拒绝采样技术自动生成中间检索链条，以扩展现有数据集。实验表明，CoRAG在多跳问答任务中显著优于基线模型，EM分数提升超10分，并在KILT基准中多个知识密集型任务上达到新的SOTA性能。

DB-GPT X TuGraph 会带来怎样的新惊喜？蚂蚁首个开源 Graph RAG 框架设计全解读

强化学习曾小健

06-25

1961

（RAG：Retrieval Augmented Generation）技术旨在把信息检索与大模型结合，以缓解大模型推理“幻觉”的问题。近来关于RAG的研究如火如荼，支持RAG的开源框架也层出不穷，并孕育了大量专业领域的AI工程应用。我们设计了一个通用的开源RAG框架，以兼容未来多样化的基础研究建设和工程化应用诉求。

面试问我LLM中的RAG，秒过!!!

python1234_的博客

10-07

1230

本篇文章涉及了 RAG 流程中的数据拆分、向量化、查询重写、查询路由等等，在做 RAG 的小伙伴一定知道这些技巧的重要性。本文是对检索增强生成（Retrieval Augmented Generation，RAG）技术和算法的全面研究，对各种方法进行了系统性的梳理。文章中还包含了我知识库中提到的各种实现和研究的链接集合。鉴于本文的目标是对现有的 RAG 算法和技术进行概览和解释，我不会深入代码实现的具体细节，只会提及相关内容，并推荐阅读详尽的文档和教程[1]。

模块化的RAG和RAG流程：第二部分

myboyliu2007的专栏

01-29

1144

定义了模块和运算符之后，它们可以帮助我们从流程角度查看各种RAG方法。每个RAG可以使用一组运算符进行排列。模块化RAG框架那么，在模块化RAG范式下，我们应该如何设计我们的RAG系统？在第二部分中，我们将深入探讨典型的RAG流程模式、具体的RAG流程实施以及最佳行业案例。典型的RAG流程模式和实施首先，让我们探索RAG流程的突出模式，以及每个模板下的具体流程，展示不同的模块和运算符是如何协调的。在RAG Flow的背景下，我们将为微调阶段划分三个不同的流程，并为推理阶段划分四个流程。

LLM之RAG理论（二）| RAG综述论文详解

wshzd的博客

12-24

3608

论文地址：https://arxiv.org/pdf/2312.10997.pdf 大型语言模型（LLMs）展示了强大的能力，但在实际应用中仍面临挑战，如幻觉现象、知识更新缓慢，以及在回答中缺乏透明度。检索增强生成（RAG）指的是在使用LLMs回答问题之前，从外部知识库中检索相关信息。RAG已被证明能显著提高答案的准确性，减少模型的幻觉现象，特别是对于知识密集型任务。通过引用来源，用户可以验证答案的准确性，并增加对模型输出的信任。它还促进了知识更新和特定领域知识的引入。RAG有效地结合

用通俗易懂的方式讲解：2024 检索增强生成技术（RAG）研究进展

2301_78285120的博客

01-08

2839

在过去的一两年里，人工智能领域目睹了检索增强生成技术（RAG）的迅猛发展，这种技术结合了强大的语言模型与信息检索系统，以期在复杂的问题解决和信息处理任务中提供更加精确和深入的答案。正是这种对前沿科技的不懈追求，推动了RAG技术在2023年成为研究的热点。随着大模型的不断进化，它们在各种任务中的表现已经达到了令人瞩目的水平。然而，无论模型的规模如何增长，它们仍受限于训练数据的质量和范围。RAG技术的出现，正是为了解决这一瓶颈。

【AI视野·今日NLP 自然语言处理论文速览第四十六期】Tue, 3 Oct 2023

TomRen

10-03

2972

AI视野·今日CS.NLP 自然语言处理论文速览 Tue, 3 Oct 2023 (showing first 100 of 110 entries) Totally 100 papers 👉上期速览✈更多精彩请移步主页 Daily Computation and Language Papers It's MBR All the Way Down: Modern Generation Techniques Through the Lens of Minimum Bayes Risk Auth

高级 RAG 技术图解概览

GitCode

01-19

1612

这样的搜索分为两步：首先利用摘要来筛选出相关文档，然后只在这个筛选出的相关文档集中继续深入搜索。

RAG 索引优化有哪些优化策略？

zc621_的博客

10-04

1101

REALM: Retrieval-Augmented Language Model Pre-Training 翻译

Toyhom的博客

02-18

1707

语言模型预训练已经显示出可以捕获数量惊人的世界知识，这对于NLP任务(例如问题解答)至关重要。但是，此知识隐式存储在神经网络的参数中，需要更大的网络才能覆盖更多的事实。为了以更模块化和可解释的方式捕获知识，我们使用潜在的知识检索器增强了语言模型的预训练，检索器使模型可以从预训练、微调和推理期间使用的大型语料库(如Wikipedia)中检索并使用文档。首次，我们展示了如何使用蒙版语言建模作为学习信号并通过考虑数百万个文档的检索步骤进行反向传播，从而以无监督的方式对这种知识检索器进行预训练。

构建LLM应用：高级RAG（第十部分）

AI公园

07-19

507

点击上方“AI公园”，关注公众号，选择加“星标“或“置顶”作者：Vipra Singh编译：ronghuaiyang导读现在，请跟随我们一起踏上另一段探索之旅，进入高级RAG技术的迷人世界。欢迎回到我们关于高级检索增强生成（RAG）技术系列的最新篇章！在本系列的前九部分中，我们深入探讨了RAG，解析了检索机制与生成模型之间的精妙互动。从掌握生成模型的基础知识到通过大型语言模型（LLMs）探索前沿技...

Pycharm（十九）深度学习

higerwy的博客

05-06

1412

深度学习是机器学习中的一种特殊方法，它使用称为神经网络的复杂结构，特别是“深层”的神经网络，来学习和做出预测。深度学习特别适合处理大规模和高维度的数据，如图像、声音和文本。深度学习、机器学习和人工智能之间的关系如下图所示：深度学习⊆机器学习⊆人工智能优点：1）精度高，性能优于其他的机器学习算法，甚至在某些领域超过了人类；2）随之计算机硬件的发展，可以近似任意的非线性函数；3）近年来在学界和业界受到了热捧，有大量的框架和库可供调。缺点：1）黑箱。

docker run -dit -p 80:80 nginx

02-07

### 使用 `docker run` 命令启动 Nginx 镜像并进行 80 端口映射为了启动一个带有端口映射的 Nginx 容器，可以使用如下命令： ```bash $ docker run -d -p 80:80 nginx:latest ``` 这条命令中的 `-d` 参数表示以后台模式运行容器；而 `-p 80:80` 则指定了宿主机的 80 端口映射到容器内部的 80 端口[^1]。如果希望挂载本地目录至容器中以便于管理配置文件或其他资源，则可以在上述基础上增加卷挂载选项。例如，将宿主机 `/data` 目录挂载到容器内的同名路径下: ```bash $ docker run -p 80:80 -v /data:/data -d nginx:latest ``` 此操作不仅实现了端口映射还完成了数据卷的绑定，使得外部能够访问容器内指定位置的数据[^2]。对于更复杂的场景，比如自定义名称以及不同端口号之间的映射关系也可以通过调整参数来实现。如下面的例子展示了如何创建名为 `test-dcokerfile` 的容器，并设置宿主机上的 8099 端口对应容器里的 8088 端口的同时挂载特定目录： ```bash $ docker run -d -p 8099:8088 --name test-dcokerfile -v /data/front:/data/front dockerfile-test ``` 这表明可以根据实际需求灵活组合各种参数完成更加个性化的部署任务[^3]。最后，在确认镜像已正确下载之后再执行以上任意一条指令即可成功启动带有所需端口映射规则的 Nginx 实例[^4]。