如何在离线的Linux服务器上部署 Ollama，并运行 Qwen 大模型（附教程）

最新推荐文章于 2025-02-12 20:05:34 发布

AI大模型教程

最新推荐文章于 2025-02-12 20:05:34 发布

阅读量4k

点赞数 49

文章标签：人工智能程序员 langchain LLM 科技大模型 AI大模型

本文链接：https://blog.youkuaiyun.com/2401_82469710/article/details/145118034

版权

手动安装 Ollama

根据Linux的版本下载对应版本的 Ollama，

查看Linux CPU型号，使用下面的命令

#查看Linux版本号
cat /proc/version
#查看cpu架构
lscpu

x86_64 CPU选择下载ollama-linux-amd64；aarch64|arm64 CPU选择下载ollama-linux-arm64

ollama不同型号

安装和运行

在有网络的环境下载好tgz安装包，并上传到离线 Linux 服务器
安装，使用下面的命令：

sudo tar -C /usr -xzf ollama-linux-amd64.tgz

启动 Ollama，使用下面的命令：

ollama serve

另外启动一个终端验证是否运行成功，使用下面的命令：

#查看所有下载的模型
ollama list

这样 Ollama 就算安装完成了。之所以下载 Ollama，是因为 Ollama 提供了大模型运行的所有环境，使用它能方便的在本地运行各种 LLM。

在 Ollama 上部署 Qwen2.5

下载 Qwen2.5

在国内 AI 社区 ModelScope 下载 Qwen2.5 模型，国外的 AI 社区 Hugging Face 也可以下载，不过要想下载国外的大模型，例如 Llama，需要填写联系信息进行申请，不过申请了也不一定会给过的。

推荐使用 Git 下载，使用下面的命令：

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-1.5B-Instruct.git

从 Safetensors 导入模型

Git 克隆下来的仓库会包含一个 model.safetensors 文件，需要将其格式转换为二进制 .bin 形式，才能由 Ollama 着手导入进行管理。

大模型格式转换主要用到一个工具 llama.cpp，使用下面的命令同步 llm/llama.cpp 子模块：

#首先克隆 Ollama 仓库
git clone [git@github.com](mailto:git@github.com):ollama/ollama.git ollama
cd ollama

#然后同步子模块
git submodule init
git submodule update llm/llama.cpp

#接着安装 python 依赖
python3 -m venv llm/llama.cpp/.venv
source llm/llama.cpp/.venv/bin/activate
pip install -r llm/llama.cpp/requirements.txt

转换模型Qwen2.5，使用下面的命令：

python llm/llama.cpp/convert_hf_to_gguf.py ./model --outtype f16 --outfile converted.bin

编写模型文件 Modelfile (没有后缀名)，文件内容如下：

FROM converted.bin
TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
"""
SYSTEM """
你是一个乐于助人的助手，但你会用20世纪30年代黑手党暴徒的风格去回答问题
"""

将转换后的 .bin 文件和 Modelfile 文件上传到离线的 Linux 服务器的同一目录下，使用下面的命令导入到 Ollama：

ollama create Qwen2.5 -f Modelfile

查看和运行大模型，使用下面的命令：

#查看大模型信息
ollama show Qwen2.5

#查看 Ollama 管理的所有大模型
ollama list

#运行大模型
ollama run Qwen2.5

#查看正在运行的大模型
ollama ps

这样 Qwen2.5 就算导入成功了，实际上 llama 工具还可对大模型进行量化，量化后的大模型会更加精确，更加节省系统资源，有关量化的信息可自行研究。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉优快云大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望