【LLM】使用 Ollama 和 RAGFlow 进行本地模型搭建&知识库问答

1. Ollama

1.1 Ollama 简介

  • Ollama 是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大语言模型而设计。
  • Ollama 支持多种操作系统,包括 macOS、Windows、Linux 以及通过 Docker 容器运行。
  • Ollama 提供对模型量化的支持,可以显著降低显存要求,使得在普通家用计算机上运行大模型成为可能。

1.2 Ollama 安装

Ollama 支持多种操作系统,包括 macOS、Windows、Linux 以及通过 Docker 容器运行。
Ollama 对硬件要求不高,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。

  • CPU:多核处理器(推荐 4 核或以上)。
  • GPU:如果你计划运行大型模型或进行微调,推荐使用具有较高计算能力的 GPU(如 NVIDIA 的 CUDA 支持)。
  • 内存:至少 8GB RAM,运行较大模型时推荐 16GB 或更高。
  • 存储:需要足够的硬盘空间来存储预训练模型,通常需要 10GB 至数百 GB 的空间,具体取决于模型的大小。
  • 软件要求:确保系统上安装了最新版本的 Python(如果打算使用 Python SDK)。

Ollama 官方下载地址:https://ollama.com/download
在这里插入图片描述

1.2.1 Windows 安装

  • 打开浏览器,访问 Ollama 官方网站:https://ollama.com/download,下载适用于 Windows 的安装程序。
  • 下载地址为:https://ollama.com/download/OllamaSetup.exe。
  • 下载完成后,双击安装程序并按照提示完成安装。
    在这里插入图片描述
  • 验证安装
    ollama --version
    
  • 更改安装路径(可选)
    OllamaSetup.exe /DIR="d:\ollama"
    
  • 更改下载模型路径
    • 修改系统环境变量 Path 添加 d:\ollama>
    • 新增系统环境 OLLAMA_MODELSd:\ollama\models

1.2.2 Linux 安装

  • Linux 下可以使用一键安装脚本,我们打开终端,运行一下命令:
    curl -fsSL https://ollama.com/install.sh | bash
    
  • 验证安装
    ollama --version
    

1.2.3 Docker 安装

访问 http://localhost:11434 即可使用 Ollama。

1.3 Ollama 通过终端运行模型

  • Ollama 运行模型使用 ollama run 命令。
    # 要运行 deepseek-r1:7b 并与该模型对话可以使用以下命令
    ollama run deepseek-r1:7b
    
  • 执行上述命令后,如果没有模型会自动下载。下载完成后,可以在终端中与之进行交互:
    在这里插入图片描述
  • 结束对话可以使用 /byeCtrl+d

2. RAGFlow

2.1 RAGFlow 本地安装与部署

2.2 RAGFlow 模型添加

  • 点击 模型供应商 选择 Ollama -> 添加模型
    在这里插入图片描述
  • 依次按照添加 LLM 要求填写必备项(添加其他模型同理)
    在这里插入图片描述
  • 点击设置默认模型进行模型配置
    在这里插入图片描述

2.3 RAGFlow 知识库创建

  • 在 RAGFlow 界面中点击 创建知识库
    在这里插入图片描述
  • 点击 新增文件上传本地文件
    在这里插入图片描述
    注:文件要成功解析后才可进行模型问答!

2.4 RAGFlow 新建聊天

  • 转到 聊天页面,点击 新建助理进行模型配置并选择知识库。
    在这里插入图片描述
  • 新建聊天后即可使用大模型进行知识库问答。
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值