一. RAG
1. 定义
RAG是一种结合了检索和生成的技术,旨在通过外部知识库来增强LLMs类模型的功能。
2. 工作原理
RAG原理分为3大结构,分别为:
索引:将知识源编码,存储在向量数据库中。
检索:接受用户输入的问题,将问题编码为向量,并在数据库中找到与之最相近的文档块。
生成:生成最终答案提交用户。
3. RAG流程示例
4. RAG vs Finetune
二. 茴香豆
茴香豆是一个基于 LLM 的群聊知识助手,由书生·浦语团队开发,可以应用于智能客服进行技术支持、领域知识对话等。
1. 茴香豆构建
1) 知识库:支持PDF,markdown等。
2) 前端工具:支持微信、飞书等。
3) LLMs后端
4) 茴香豆本体