目录
本节课的主要内容:
RAG介绍
原始的InternLM2-Chat-7B无法回答茴香豆是什么,而针对这种新增知识的情况,想要没有训练过程实现垂直领域的LLM助手,就用到了RAG技术。
RAG定义
利用检索和生成技术,通过外部知识库来增强LLM的性能。
RAG工作原理
索引、检索、生成
向量数据库
RAG工作流程
RAG发展进程
图中展示了三种RAG范式:Naive RAG、Advanced RAG、Modular RAG
RAG常见优化方法
- 嵌入优化、索引优化、查询优化、上下文管理
其中后两种方法就是Advanced RAG范式中提出的前检索和后检索部分。 - 常见的三种检索方式:迭代检索、递归检索、自适应检索
- 大模型技术:LLM微调
RAG和微调的对比
LLM模型优化方法比较
LLM常用优化方法:微调、提示工程、RAG技术
从任务对外部知识需求和对模型适配度的需求两个方面来对比。
RAG对外部知识需求大,微调对模型适配度需求大。
提示工程对两者需求都不大,但是不能适应新知识,对特定任务也很难有专业的表现。
如何评价RAG技术
一般对检索和生成分别评价
RAG总结
茴香豆介绍
茴香豆的核心特性
茴香豆的构建
组成部分:知识库、前端、大模型、茴香豆
茴香豆的工作流
三个部分:预处理、拒答工作流、应答工作量
茴香豆完整工作流
为了能够更加有效的回答,应答模块采用多来源检索、混合模型、安全评估等方式来确保回答内容的准确性。