ubuntu22.04安装RAGFlow配合DeepSeek搭建本地知识库

一、简介

RAGFlow 是一个基于对文档的深入理解的开源 RAG(检索增强生成)引擎。当与 LLM 集成时,它能够提供真实的问答功能,并以来自各种复杂格式数据的有根据的引用为后盾。

二、安装

1.环境要求
  • CPU ≥ 4 核 (x86);
  • RAM ≥ 16 GB;
  • 磁盘 ≥ 50 GB;
  • Docker ≥ 24.0.0 和 Docker Compose ≥ v2.26.1;
2.系统配置

vm.max_map_count.此值设置进程可以具有的最大内存映射区域数。其默认值为 65530。虽然大多数应用程序需要的映射少于 1000 个,但减小此值可能会导致异常行为,并且当进程达到限制时,系统将引发内存不足错误。
操作步骤:

# 检查vm.max_map_count
sysctl vm.max_map_count
# 临时设置
sysctl -w vm.max_map_count=262144
# 永久设置
vim  /etc/sysctl.conf
vm.max_map_count=
### 部署 DeepSeek 本地知识库 要在 Linux 环境下成功部署 DeepSeek 并构建本地知识库,可以按照以下方法操作: #### 安装依赖项 首先,在 Ubuntu 22.04安装必要的软件包。这包括 Python 和其他工具。 ```bash sudo apt update && sudo apt upgrade -y sudo apt install python3-pip git curl wget build-essential libssl-dev -y ``` 此命令会更新系统并安装所需的开发工具和依赖项[^1]。 #### 创建虚拟环境 为了隔离项目环境,建议创建一个独立的 Python 虚拟环境。 ```bash pip3 install --upgrade pip virtualenv virtualenv deepseek_env source deepseek_env/bin/activate ``` 激活虚拟环境后,后续所有的 Python 包都会被安装到该环境中。 #### 下载 DeepSeek 模型 DeepSeek 提供了多种预训练模型,可以通过 Ollama 或 Hugging Face Hub 获取这些模型。 如果使用 Ollama,则需先安装它: ```bash curl https://ollama.ai/install.sh | sh ollama pull deepseek/7b ``` 上述命令下载了一个具有 70 亿参数的 DeepSeek 模型版本。 #### 构建本地知识库 对于本地知识库的支持,推荐采用 RAGflow 方法来替代传统的嵌入方式,因为后者容易引发机器幻觉问题[^2]。 以下是设置 RAGflow 的基本流程: 1. **准备数据集** 将要索引的知识存储为 JSONL 文件或其他结构化格式。 2. **启动向量数据库** 使用 Milvus 或 ChromaDB 来管理高维向量表示的数据点。 ```bash docker run -d --name milvus -p 19530:19530 -p 8080:8080 milvusdb/milvus:v2.3.0 ``` 3. **加载数据至向量数据库** 编写脚本来解析输入文件并将它们转换成适合检索的形式。 4. **集成前端界面** Cherry Studio 是一种简单易用的选择,能够快速搭建交互式的 Web UI 接口。 #### 测试服务性能 完成以上步骤之后,验证整个系统的功能是否正常工作非常重要。例如,尝试提交一些样例查询以确认返回的结果合理且高效。 在 RTX 3090 运行环境下,理论上每天最多能处理大约五万 token 的请求负载。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值