快速发展的生成式 AI 领域专注于构建可以创建逼真内容(例如文本、图像、音频和合成数据)的神经网络。生成式 AI 正在多个行业中引发革命,通过快速创建内容、为智能知识助手提供支持、增强软件开发以编码副驾驶,以及跨多个领域自动执行复杂任务。
然而,生成式 AI 模型基于有限数据进行训练,只知道数据能告诉他们的内容。实际上,这是一个问题:确保生成内容的准确性和相关性,特别是对于模型训练数据中没有的信息。这些“知识差距”可能是时间方面的(例如,所有训练数据都在 2023 年 4 月之前),也可能是领域方面的(例如,您的任何专有数据都未用于训练模型)。
这正是检索增强生成(RAG)发挥作用的地方。RAG 利用外部信息来源增强生成式模型(例如大型语言模型(LLM)),以有效地为模型提供它不知道的“事实”。这样做将导致响应更加准确且与上下文相关,具体取决于外部信息的质量和模型的质量。
如何使用 RAG 的具体示例包括:
- 最新的聊天机器人:RAG-enabled 聊天机器人可以从公司的数据库中实时获取信息,以便准确响应客户查询。例如,模型不知道的最近停机情况。
- 上下文感知内容