一、引子
我们需要通过一些手段来提升LLM生成内容质量,主要的有下面三项,本文将主要介绍RAG。
1. 提示工程(Prompt Engineering)
通过精心设计的提示(Prompt)来提升输出的质量
2. 模型微调(Fine-tune)
模型微调是指在已有的预训练模型(比如GPT-4o、Llama 3.3等)基础上,使用特定的数据集进行二次训练,以调整模型参数,使其能够在特定领域的任务上表现更好。
3. 检索增强生成(Retrieval-Augmented Generation,RAG)
检索增强生成是一种利用信息检索来优化LLM输出的技术,通过在生成结果之前引用训练数据之外的知识库,丰富了上下文,从而增强生成内容的准确性。RAG的好处既能保证时效性,又能避免高昂的微调成本
RAG的本质就是根据用户查询,从外部知识库(即使更新)中检索相关的知识,随后以附加内容的形式添加到提示中,增强LLM的生成内容。

二、RAG工作流
RAG的工作流分成索引、检索、生成两个阶段。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



