DeepSeek+本地知识库配置

DeepSeek+本地知识库

一、安装 BAAI/bge-m3 模型

1. 通过 Ollama 本地部署

步骤:

  • 安装 Ollama

    image-20250327205145549
  • 访问 Ollama 官网 (https://ollama.com/download)

  • 如果太慢,可以替换:

    https://ollama.ruanmao.net

  • 下载对应安装包,双击完成安装。

  • 拉取 BAAI/bge-m3 模型
    打开终端(Terminal)(建议以管理员身份),输入以下命令:

ollama pull bge-m3

类似输出:

(base) MacBook-Pro:~ dajiangyang$ ollama pull bge-m3
pulling manifest 
pulling daec91ffb5dd... 100% ▕████████████████████████████████████████████████████████████████████████████▏ 1.2 GB     pulling a406579cd136... 100% ▕████████████████████████████████████████████████████████████████████████████ 1.1 KB       pulling 0c4c9c2a325f... 100% ▕████████████████████████████████████████████████████████████████████████████▏  337 B                         
verifying sha256 digest 
writing manifest 
success 

等待下载完成(约 1.2 GB),显示 success 即表示成功。

二、基于Cherry Studio搭建(首选)

cherry Studio 文本分割不能选择文本长度和重叠度。

2.1 下载cherry studio

根据自己的环境下载cherry studio

https://cherry-ai.com/download

在这里插入图片描述

安装的时候,注意安装到其他磁盘,不要在c盘安装。

2.2 建立本地模型知识库

2.2.1 配置本地cherry studio中DeepSeek

在这里插入图片描述
点击配置(按钮1指示),找到“模型服务”,再找到“深度求索”,将API密钥输入,并打开“ON”开关。

2.2.2 配置本地Ollama

在这里插入图片描述

点击管理(按钮1指示)

在这里插入图片描述

2.2.3 知识库配置

在这里插入图片描述

点击“添加”

在这里插入图片描述

点击“确定”

在这里插入图片描述

2.2.4 使用知识库

在这里插入图片描述

¥¥¥ END ¥¥¥

附录:

1、BAAI/BGE-M3 简介

BAAI/BGE-M3 是由北京智源研究院(BAAI)和中国科学技术大学联合开发的开源语义向量模型,专注于多语言、多粒度和多功能检索任务。该模型支持超过100种语言,最大输入长度达8192词符,能够处理句子、段落、篇章及文档等不同粒度的文本。其核心创新在于集成三种检索模式:

  1. 稠密检索:通过特殊标记[CLS]生成单个向量进行语义匹配;
  2. 稀疏检索:基于词项权重实现类似BM25的关键词检索;
  3. 多向量检索:利用细粒度交互提升相关性判断精度。

BGE-M3通过混合检索(联合三种模式)在多项评测中表现领先,尤其在多语言和跨语言任务中显著优于基线模型(如mE5)。其训练数据结合无监督语料、高质量标注数据和GPT-3.5生成的合成数据,并通过自学习蒸馏和长文本优化技术(如MCLS)提升性能。该模型适用于搜索、问答及RAG(检索增强生成)场景,且开源免费商用,技术细节和模型已发布于Hugging Face平台。

### 如何在 DeepSeek 中集成和使用本地知识库 为了实现在 DeepSeek 中集成并使用本地知识库的功能,主要依赖于两个方面的工作:一是确保 DeepSeek 的成功本地部署;二是将选定的知识库或笔记软件与已部署的 DeepSeek 进行对接。 #### 一、准备环境与安装必要组件 按照官方文档说明完成 Ollama 和 AnythingLLM 的安装配置工作[^1]。这一步骤对于后续能够顺利连接到自定义的数据源至关重要。 #### 二、选择合适的知识库/笔记应用 针对希望接入的知识库类型,建议考虑支持 API 接口调用且具有良好社区评价的应用程序。例如 Notion 或者 Evernote 等平台提供了丰富的开发接口,便于与其他服务建立联系[^2]。 #### 三、创建API接口用于数据交互 为了让 DeepSeek 能够读取来自外部存储的信息,在所选笔记工具中设置 Webhook 或 RESTful APIs 来提供结构化的 JSON 数据给 DeepSeek 实例处理。此过程可能涉及到身份验证机制的设计以及权限管理策略的确立。 #### 四、修改DeepSeek配置文件指向新的数据源路径 编辑 DeepSeek 配置文件中的相应字段来指定新加入的知识库位置。通常情况下会涉及更改数据库链接字符串或是增加额外参数以适应特定格式的要求。 ```json { "knowledge_base": { "type": "custom", "source_url": "http://localhost:8080/api/v1/documents" } } ``` 以上JSON片段展示了如何调整配置使得 DeepSeek 可以识别新增加的数据源地址。 #### 五、测试连通性和功能性 最后一步是对整个系统的稳定性进行全面检测,确认可以从 DeepSeek 正常检索到来自本地知识库的内容,并且具备基本的操作能力如查询、更新等操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值