RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过引入外部知识库来增强模型的生成能力。简单来说,RAG 让模型在回答问题时,能够像“查百科全书”一样,从外部知识库中检索相关信息,并生成更准确、更丰富的答案。
本篇提供两种方式实战RAG。
1、使用硅基流动提供的DeepSeek API+CherryStudio搭建本地知识库。
2、使用OLlama私有化部署DeepSeek大模型+CherryStudio搭建本地知识库。
硅基流动
硅基流动(SiliconFlow)是一家专注于AI基础设施(AI Infra)的科技公司,成立于2023年8月,总部位于北京海淀区。公司以降低大模型应用开发门槛和成本为核心使命,致力于通过技术创新推动生成式人工智能(GenAI)的普及与发展。
点击官网:https://siliconflow.cn/
模型广场
点击模型广场,可以看到有DeepSeek的各个版本,可以根据情况选择合适的大模型。
API密钥
点击API密钥,新建API密钥,将创建好的密钥复制,后面