本地化部署:Ollama+Deepseek+CherryStudio

一、背景说明

基于作者当前安全运维场景的瓶颈,需要借助AI能力来辅助安全运维工程师快速有效的判断故障问题及分析处置方案,因此,需要建立一套符合场景化的AI应用,用来满足当前运维需求。

二、使用组件

系统版本:centos7.5

Ollama:v0.5.11

开源的本地大语言模型运行框架,设计用于简化在本地运行大型语言模型的过程,降低使用门槛。

Deepseek:deepseek-R1:7b

一款由国内人工智能公司研发的大型语言模型

Cherrystudio:v0.9.24

聚合主流大语言模型服务的桌面工具,通过直观的可视化界面和远程API接口,实现了跨平台调用各类模型。

三、部署逻辑说明

        在服务器中部署ollama、deepseekr1:7b,通过ollama部署工具,调用deepseek,达到运行大模型的目的;在此基础上通过cherrystudio调用deepseek的API接口,实现用户的接入。

四、Ollama+deepseek安装步骤

4.1、基础环境部署

下载ollama客户端,因部署在服务器端,为稳定性考虑,建议下载Linux版本,直接复制一键命令

curl -fsSL https://ollama.com/install.sh | sh

在服务器本地执行一键安装命令,完成ollama的安装;

安装完成后执行命令ollama -v查看ollama版本,以确认是否正确安装

在ollama中执行命令安装deepseek本地化部署安装包,执行命令:

ollama run deepseek-r1:7b(此处会在下载到95%左右,速率下降至200K左右)

安装完成后,页面显示对话框;

测试在对话框中输入问候语,确认DS是否有正常返回信息;

执行ollama ls查看已下载的模型,通过ollama run <NAME>运行对应模型,NAME字段后续再cherrystudio中需要用到。

到此,DS本地化部署完成,但仅限本地访问;

4.2、远程访问限制

确认端口监听状态

sudo ss -tulpn | grep 11434

若显示 127.0.0.1:11434 则说明仅限本地访问

修改/etc/system/system/ollama.service文件,修改ollama监听地址为全部可以访问

修改完成后,执行

sudo syetemctl daemon-reload   重新加载ollama服务

sudo systemctl restart ollama     重新启动ollama

再次执行命令查看访问地址限制是否为全局

测试远程可通过telnet工具访问11434端口,至此ollama+deepseek已全部安装完成,可正常接入用户使用

五、Cherrystudio安装步骤

下载cherrystudio工具:Cherry Studio - 全能的AI助手

一键安装即可

安装完成后,通过在设置-模型服务中,选择ollama模型,并进行相关配置;

步骤5:添加地址为服务器端的地址及DS使用端口

步骤7:模型ID为在ollama ls命令查看中显示的NAME字段内容

步骤8:配置完成后,通过检查工具,检查模型是否可用。

步骤4:添加模型时,需要选择对应模型名称,名称为在ollama ls命令查看中显示的NAME字段内容

添加完成后,可正常与大模型进行对话。

内容概要:本文档详细介绍了 DEEP SEEK 的本地部署及其与私有知识库整合的具体步骤。主要包括两大部分:Ollama 平台的使用方法和 DeepSeek R1 模型的安装指导。Ollama 是一种能够便捷部署深度学习模型(尤其是大型语言模型)的工具,它支持多种操作系统并在命令行中执行相应操作以完成从下载、配置直至实际使用的全过程。文中针对不同硬件条件给出了具体配置推荐,并逐步讲解了从安装 Ollama 到运行特定大小版本 DeepSeek 模型(如 1.5b 至 70b),再到设置 API 键连接云端服务以及最后利用 Cherry Studio 构建个人专属的知识库的一系列操作指南。同时附上了多个辅助资源如视频教程、在线演示平台链接以便更好地理解和学习整个过程。 适合人群:适合有一定技术背景且想探索本地部署人工智能模型的初学者或是希望通过本地化部署提高效率的研发团队。 使用场景及目标:一是帮助用户了解并掌握在本地环境中配置高性能 AI 工具的全流程操作;二是使用户能够根据自己拥有的计算资源情况合理挑选合适的模型大小;三是通过集成私有知识库为企业内部提供定制化的问答或咨询系统,保护敏感数据不受公开访问威胁。 其他说明:考虑到安全性和稳定性因素,作者还提供了应对潜在风险如遭遇网络攻击时选用可靠替代源——硅基流动性 API 来保障服务持续稳定运作,并强调在整个实施过程中应谨慎处理个人信息及企业关键资产以防泄露事件发生。此外,提到对于更高级的功能例如基于 Ollama 实现本地知识库还有待进一步探讨和发展。
### 本地部署 OllamaCherryStudioDeepSeek 模型并调用 API #### 部署概述 为了在本地环境中成功部署 Ollama 并集成 DeepSeek 模型,同时利用 CherryStudio 实现用户交互界面并通过其 API 接口完成模型调用,需遵循一系列配置流程。以下是详细的说明。 --- #### 基础环境准备 首先,在服务器上构建适合运行大型语言模型的基础环境。这一步骤涉及安装必要的依赖项和工具链,确保硬件资源满足需求[^1]。具体操作如下: - **操作系统支持**: Linux 或 macOS 是推荐的选择。 - **GPU 支持 (可选)**: 如果计划加速推理过程,则需要 NVIDIA GPU 及 CUDA 工具包的支持。 - **内存与存储空间**: 至少分配 8GB RAM 来加载较小版本的 DeepSeek 模型(如 `deepseek-r1:7b`),而更大规模变体可能要求更多资源。 --- #### 安装 Ollama Ollama 提供了一个简洁易用的框架来管理多种预训练模型,包括来自 DeepSeek 的系列成员。按照官方文档指示执行以下命令可以快速启动服务[^3]: ```bash brew install ollama # 对于 Mac 用户而言适用此方法获取最新二进制文件; curl https://ollama.ai/install.sh | sh # 替代方案适用于其他平台类型。 ``` 随后验证安装成果: ```bash ollama version # 查看已安裝之 Ollama 版本号。 ``` 接着下载目标模型实例之一——这里选取的是较轻量级选项 `deepseek-r1:7b` : ```bash ollama pull deepseek/r1:7b ``` 确认模型可用状态可通过浏览器访问默认监听端口上的网页界面 (`http://localhost:11434`) ,或者借助 RESTful 请求查询现有模型列表信息: ```json GET http://localhost:11434/v1/models ``` 上述返回 JSON 数据结构应包含刚拉取成功的条目名称及其元属性描述等内容。 --- #### 设置 CherryStudio 作为图形化前端解决方案的一部分,CherryStudio 能够显著简化最终使用者同后端 LLMs 进行沟通的过程。依照指引步骤完成软件本身的获取之后,还需调整若干参数使之适配先前建立起来的服务架构: 1. 下载并安装 CherryStudio 应用程序至个人计算设备之上。 2. 登录进入应用内部设定区域找到关于自定义远程连接的部分。 3. 将原本指向云端服务商的标准 URL 地址替换为我们刚才搭建完毕后的私有网络位置字符串形式表达(`http://<your_server_ip>:11434`)。 4. 添加期望使用的特定型号标签名到指定字段里去匹配实际存在的实体对象。 完成后即可尝试发起简单的测试会话以检验整个链条是否正常运作无误。 --- #### 利用 API 进行高级控制 除了直观的操作方式之外,开发者还可以充分利用暴露出来的 HTTP endpoints 编写脚本来自动化某些任务逻辑或是嵌入第三方应用程序当中形成更加丰富的用户体验效果。下面给出一段 Python 示例代码片段展示如何发送 POST 请求给定输入文本从而获得相应输出结果: ```python import requests url = 'http://localhost:11434/v1/completions' payload = { "model": "deepseek-r1", "prompt": "Explain quantum computing.", } response = requests.post(url, json=payload) if response.status_code == 200: print(response.json()['choices'][0]['text']) else: print(f'Error {response.status_code}: {response.text}') ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值