Ollama本地部署qwen2.5

一、概述

Ollama 是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。支持多种操作系统,包括 macOS、Windows、Linux 以及通过 Docker 容器运行。Ollama 提供对模型量化的支持,可以显著降低显存要求,使得在普通家用计算机上运行大型模型成为可能。

官网:https://ollama.com

二、安装Ollama

环境

操作系统:Windows 11专业版

cpu:4核

内存:16G

显存:2G

下载

下载window版本,然后下一步,下一步安装即可。

安装成功后,打开cmd窗口,验证ollama是否安装成功

环境变量

在下载模型之前,先设置一下环境变量,默认会下载到C盘。如果你的C盘空间足够大,可以忽略。

搜索高级设置,打开

 点击环境变量

 添加2个环境变量

OLLAMA_MODELS,E:\Ollama\models

OPENAI_API_KEY,e85ed351-1bf4-49ea-8c95-945cdbb85eef

 参数解释:

OLLAMA_MODELS,模型下载的默认目录,因为e盘空间比较大,所以设置在这里。

OPENAI_API_KEY,这个是用来给AI模型客户端使用的,用来调用大模型。

三、下载模型

打开网页:https://ollama.com,搜索关键字qwen2.5,就会跳转页面:https://ollama.com/library/qwen2.5

这里选择3b,相对比较最小的模型

 复制命令,到cmd运行

ollama run qwen2.5:3b

下载成功后,效果如下:

注意:ollama下载模型的过程中,会进行限速。比如:82秒之后,速度就会明显下降!

解决办法,就是中断下载,然后再次下载,会接着上一次下载的文件继续下载,速度就会提升上来。到了82秒之后,会再次下降,如此往复循环。

然后,就可以提问了。

### 在本地使用Ollama部署Qwen2.5 7B模型的方法或要求 #### 硬件与软件环境需求 为了在本地成功部署Qwen2.5 7B模型,需满足以下硬件和软件环境条件[^1]: - **硬件需求**:建议使用至少16GB的GPU显存以确保模型运行流畅。如果显存不足,可能需要启用CPU推理或减少批量大小。 - **操作系统**:支持主流操作系统,包括Linux、macOS和Windows。推荐使用Linux系统以获得更好的性能和支持[^1]。 - **软件依赖**:需要安装Docker以运行Ollama服务。确保Docker版本不低于20.10.0[^1]。 #### 安装Ollama 以下是Ollama的安装步骤,适用于大多数操作系统[^1]: ```bash # 下载并安装Ollama二进制文件 curl -O https://ollama.ai/install.sh sh install.sh ``` 完成安装后,可以通过以下命令验证Ollama是否正确安装: ```bash ollama --version ``` #### 下载Qwen2.5 7B模型 通过Ollama提供的模型管理功能下载Qwen2.5 7B模型[^1]: ```bash ollama pull qwen2.5-7b ``` 此命令会从Ollama的模型仓库中拉取Qwen2.5 7B模型,并自动存储在本地缓存中。 #### 启动Ollama服务 启动Ollama服务以使模型可用: ```bash ollama serve ``` 此命令会在后台启动一个HTTP服务,默认监听端口为`11434`[^1]。 #### 使用Qwen2.5 7B模型 可以通过命令行或HTTP API与模型交互。以下是一个简单的命令行示例: ```bash ollama run qwen2.5-7b "请生成一段关于人工智能的短文。" ``` 如果选择通过HTTP API调用模型,可以使用以下代码示例(Python): ```python import requests url = "http://localhost:11434/api/generate" payload = { "model": "qwen2.5-7b", "prompt": "请生成一段关于人工智能的短文。", } response = requests.post(url, json=payload) print(response.json()["response"]) ``` #### 注意事项 - 如果模型推理速度较慢,可尝试优化GPU设置或减少输入长度[^1]。 - Ollama支持多线程推理,可根据硬件配置调整线程数以提升性能[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值