附录
本附录旨在为读者提供额外资源,帮助读者将理论知识转化为实际应用。我们将列出 RAG 系统开发中常用的工具与库,提供实用的案例代码仓库地址,并解答在 RAG 开发和部署过程中可能遇到的常见问题。
附录 A:常用工具与库清单
构建一个健壮的 RAG 系统需要集成多个组件。以下是我们在开发和部署过程中常用的工具和库。
向量数据库/检索引擎
向量数据库是 RAG 系统的核心,用于存储和检索文本的向量表示。
-
开源选项:
适用于自建和需要高度定制的场景。
- Milvus: 高性能、高可用、可扩展的云原生向量数据库,支持多种相似度指标和索引类型。
- Weaviate: 一个开源的向量搜索引擎,支持语义搜索、问答和混合搜索,内置了对多种 Embedding 模型的支持。
- Qdrant: 专注于高性能向量搜索的数据库,支持基于 Payload 的过滤,适合精确搜索。
- Chroma: 轻量级、易于使用的嵌入数据库,可以作为本地测试或小型项目的快速启动选项。
-
云服务