Ollama 部署本地大模型与使用（附教程）

最新推荐文章于 2025-04-07 09:15:00 发布

LLM大模型

最新推荐文章于 2025-04-07 09:15:00 发布

阅读量1.1k

点赞数 8

文章标签：人工智能 AI大模型 langchain LLM 大模型入门程序员大模型

本文链接：https://blog.youkuaiyun.com/DEVELOPERAA/article/details/146439545

版权

前言

本文将介绍如何通过 Ollama 部署 Llama3 模型，并通过接口调用，简化这一过程。

Ollama 简介

Ollama 是一个本地运行的大语言模型（LLM）工具平台，允许用户在本地设备上运行和管理大模型，而无需依赖云服务。它支持多种开源模型，并提供了用户友好的接口，非常适合开发者和企业使用。

安装 Ollama

首先，从 Ollama 官网下载安装包，并按照提示完成安装。

Ollama 命令介绍

Ollama 提供了几个简单易用的命令，基本功能如下：

Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       启动 Ollama 服务
  create      从 Modelfile 创建一个模型
  show        查看模型详细信息
  run         运行一个模型
  stop        停止正在运行的模型
  pull        从注册表拉取一个模型
  push        将一个模型推送到注册表
  list        列出所有可用的模型
  ps          列出当前正在运行的模型
  cp          复制一个模型
  rm          删除一个模型
  help        获取关于任何命令的帮助信息

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

下载大模型

在 Ollama 官网的 Models 页面中，可以找到 Ollama 支持的大模型列表。

如果没有明确的模型选择，建议使用阿里的 qwen2.5:7b 或 Meta 的 llama3.1:8b。7b 以上的大模型通常能提供更好的对话效果。

查看模型信息

选择一个模型后，点击进入可以查看模型的详细信息。

下载模型

使用 ollama run 命令可以在拉取模型后直接进入交互窗口。如果只想下载模型而不进入交互界面，可以使用 ollama pull 命令。

ollama run llama3.2:1b

等待模型下载完成后，会直接进入交互界面。

在命令行中输入消息，即可与模型进行交互。

交互窗口命令

在交互窗口中输入 /? 可以查看可用命令。

Available Commands:
  /set            设置会话变量
  /show           显示模型信息
  /load <model>   加载会话或模型
  /save <model>   保存当前会话
  /clear          清除会话上下文
  /bye            退出会话
  /?, /help       显示命令帮助
  /? shortcuts    显示快捷键帮助

Use """ to begin a multi-line message.

例如，使用 /show 命令查看模型信息：

输入 /bye 即可退出交互界面。

调用 Ollama 接口

Ollama 提供了丰富的 API 接口，供外部调用访问。详细的接口文档可以在官方 GitHub 中找到。

接口名称	接口地址	请求方法	接口描述
Generate	`/api/generate`	POST	使用提供的模型为给定提示生成响应。
Chat	`/api/chat`	POST	使用提供的模型生成聊天中的下一条消息
Create	`/api/create`	POST	从 Modelfile 创建一个新的模型。
Tags	`/api/tags`	GET	列出本地可提供的型号。
Show	`/api/show`	POST	获取指定模型的详细信息。
Copy	`/api/copy`	POST	从现有模型创建副本。
Delete	`/api/delete`	DELETE	删除模型及其数据。
Pull	`/api/pull`	POST	从 Ollama 库中下载指定模型。
Push	`/api/push`	POST	将模型上传到模型库。
Embed	`/api/embed`	POST	使用指定模型生成嵌入。
ListRunning	`/api/ps`	POST	列出当前加载到内存中的模型。
Embeddings	`/api/embeddings`	POST	生成嵌入（与 Embed 类似，但可能适用场景不同）。
Version	`/api/version`	GET	获取 Ollama 服务的版本号。

检查服务

安装 Ollama 后，服务通常会自动启动。为了确保服务正常运行，可以通过以下命令检查：

Ollama 默认端口为 11434，访问地址为 127.0.0.1:11434。

curl http://127.0.0.1:11434

如果服务未启动，可以使用以下命令启动：

ollama serve

调用模型列表接口

首先，调用一个简单的接口来查询模型列表：

curl http://localhost:11434/api/tags

返回结果：

调用生成接口

接下来，调用生成接口来获取模型的响应：

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2:1b",
  "prompt": "天空为什么是蓝色的?"
}'

默认情况下，接口会返回流式数据：

可以通过设置 stream: false 参数，直接返回完整内容：

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2:1b",
  "prompt": "天空为什么是蓝色的?",
  "stream": false
}'

此时，接口会等待模型生成完整响应后一次性返回：

结语

通过本文，我们成功使用 Ollama 部署并调用了 Llama 大模型。Ollama 提供了简单易用的接口，极大简化了大模型的本地部署和调用过程。对于其他接口如 chat、pull、delete 等，可以参考官方文档进行调用。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

基于此，我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近70次后，终于把整个AI大模型的学习门槛，降到了最低！

在这个版本当中：

第一您不需要具备任何算法和数学的基础
第二不要求准备高配置的电脑
第三不必懂Python等任何编程语言

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型教程已经给大家整理并打包，现在将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

五、AI产品经理大模型教程

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望