Ollama实现开源大模型本地化安装部署

最新推荐文章于 2025-11-03 11:20:09 发布

原创

最新推荐文章于 2025-11-03 11:20:09 发布 · 4.1k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#运维 #人工智能 #AI编程 #ai #语言模型

本文将介绍如何使用ollama实现对开源大模型的本地化部署，让每个有技术能力的企业都可以“套壳”大模型，在各自的专业领域内“遥遥领先“。在本案例中我将使用两个开源的软件：

ollama：是一个轻量级可扩展的框架，它可以轻易地帮你管理本地的众多开源大模型，并支持众多的开源大模型，包括llama 2 、gemma、codegemma、Mistral等，并允许用户自定义和创建自己的模型。
open-webui：是一个开源的Web界面，用于同各种大语言模型进行交互，并可以同ollama所管理的大语言模型进行快速集成。它提供了一个用户界面，允许用户输入prompt指令，并获得所选择模型生成的响应，由于本地化部署，其返回的结果和人工反馈又可以做为人工标注的数据，对开源大模型进行微调和强化学习用的训练数据。

本文主要介绍如下内容：

安装ollama
选择并安装大模型
安装Open-WebUI
测试大语言模型效果
大语言模型优化

安装Ollama

首先，打开Ollama的官方网站（https://ollama.com/download），如下图所示，选择自己操作系统版本即可：

下载完成之后，双击安装，安装完成之后会在Mac上看到如下的图标，代表安装完成：

选择并安装大模型

在Ollama的官方网站有一个Models菜单，如下图所示：

点击即可看到Ollama所支持的所有大模型列表，这里的下拉列表有很

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

drbool

关注关注

15
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

本地部署ollama大模型

张泓锐的博客

09-28

1910

Ollama 大模型通常是通过 Docker 来运行的，因此首先需要确保本地已经安装了 Docker。

精选资源

Ollama: 开源大语言模型本地部署框架特点与应用

01-27

内容概要：本文详细介绍了 Ollama 这一开源的大语言模型本地部署框架，它具有广泛的操作系统兼容性（macOS、Windows、Linux 和 Docker），提供大量开源 LLM 模型供用户自由选择。并且提供 Python 和 JavaScript 编程...

参与评论您还未登录，请先登录后发表或查看评论

【开源大模型本地化部署开发】PyTorch部署开发deepseek

人工智能(AI)技术，大模型技术，深度学习，机器学习，计算机视觉，AI工具实践应用等分享

02-24

1144

以下是基于PyTorch调用DeepSeek本地开源大模型开发的三个详细案例，涵盖模型调用、架构优化及微调实践，每个案例均包含代码实现及注释说明：

热门推荐

u010522887的专栏

07-24

3万+

Ollama 也许是当前最便捷的大模型部署工具，配合Open WebUI，人人都可以拥有大模型自由。

2000+多种开源大模型随意部署！一键搭建本地大模型，不挑环境、不挑配置（ollama 安装部署教程《Windows/Linux，Mac》）

淘小欣的博客

10-21

3430

Ollama是一个支持在WindowsLinux和MacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如Qwen模型等。用户只需一行命令就可以启动模型。跨平台支持WindowsLinuxMacOS系统。提供了丰富的模型库,包括QwenLlama等1700+大语言模型,可以在官网中直接下载使用。支持用户上传自己的模型。用户可以将等地方的ggml格式模型导入到ollama中使用。也可以将基于pytorch等格式的模型转换为ggml格式后导入。允许用户通过编写。

Ollama：一个在本地部署、运行大型语言模型的工具

weixin_59191169的博客

05-28

8223

所谓自定义模型就是不适用Ollama官方模型库中的模型，理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手，你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统，支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root，密码为 123456。

Ollama 部署本地大模型

07-26

1713

工作需要，被指派对大模型做技术调研，又不想花钱买各大产商的key，所以就考虑部署本地的大模型，了解到 Ollama 开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。便在自己电脑上安装了，记录下安装以及使用过程。

在你的电脑上部署和使用Ollama，轻松实现大模型本地化运行

07-15

Ollama是一款专门为个人电脑设计的工具，它的主要功能是让使用者能够在本地轻松运行开源的大模型，如Llama 3、Mistral、...此外，Ollama还支持海量主流开源模型，并内置API服务，使得开发者集成和使用起来非常方便。

OLLAMA: 开源大语言模型的本地部署框架及其应用解析

01-27

内容概要：本文介绍了Ollama这一面向开发者和研究人员的开源大语言模型本地部署框架。它拥有跨多个平台的支持能力（如macOS、Windows、Linux与Docker）、丰富的模型库，提供API及库以便更好地集成于各类应用场景中，...

精选资源

Ollama: 开源多平台大语言模型本地部署框架详解与应用

01-31

内容概要：文章详细介绍了开源多平台大语言模型（LLM）本地部署框架——Ollama。Ollama支持多种操作系统，提供了丰富多样且高质量的开源大语言模型供用户按需选用。该工具拥有完善的Python、JavaScript支持，并配备...

AI菜鸟向前飞 — LLM简介

2401_82469710的博客

05-11

2226

AI菜鸟向前飞 — LLM简介

本地部署大模型？看这篇就够了，Ollama 部署和实战

datian1234的博客

02-09

5441

有小伙伴问，如果我想在本地搞个大模型玩玩，有什么解决方案？ Ollama，它来了，专为在本地机器便捷部署和运行大模型而设计。也许是目前最便捷的大模型部署和运行工具，配合Open WebUI，人人都可以拥有大模型自由。今天，就带着大家实操一番，从 0 到 1 玩转 Ollama。

本地大模型1：安装部署本地Ollama大模型

weixin_74825941的博客

09-10

2万+

对ollama本地大模型的基本使用，下载了llama3.1:8b，可以进行基本的问答，推荐了两篇调用ollama的文章

本地部署 Ollama

engchina的专栏

01-07

9034

本地部署 Ollama

本地部署大模型？Ollama 部署和实战，看这篇就够了！_ollama本地部署

Z4400840的博客

08-21

1473

本文介绍了如何在本地部署和运行大模型工具Ollama，支持Mac、Windows和Linux系统。Linux可通过一键脚本或Docker安装，并提供了配置修改指南。Ollama支持从0.5B到236B的多种模型，用户可根据设备配置选择合适的模型。文章还介绍了Ollama的常用命令和模型库，帮助用户快速上手使用这一便捷的大模型本地运行工具。通过Ollama，用户可以轻松在本地实现大模型的部署和应用。

【AI工作流】Ollama本地化大模型安装

m0_70486148的博客

08-23

3664

为了给以后的工作流和本地模型铺路，有必要说一下Ollama本地大语言后台的安装。1.Ollama在安装之前，有必要先说明一下Ollama是什么。Ollama是一个大语言模型的服务后台，能够在零基础的前提下帮助用户轻松部署大语言模型。其特点包括如下：优点：Ollama后台服务能够帮助用户轻松搭建大语言模型服务，并且提供相应的API以扩展到其他如Dify等Web前台以及Obsidian等笔记软件，以最快的速度形成AI问答/AGENT/工作流等工作形式。

开源项目Ollama让你的电脑也可以运行大模型

2401_82469710的博客

03-05

3622

从OPEN AI推出大模型已经过去一年多了，想必大家已经感受到了AI对我们的影响。大型模型极具用途，其提升的准确性和处理更复杂任务的能力都令人赞叹。

【大模型本地运行与部署框架】Ollama的安装与模型的运行和部署

朱砂绛的博客

08-19

1068

Ollama是一款开源的本地大模型运行框架，支持多种大语言模型（如DeepSeek、LLaMA、Qwen等）的本地部署。本文介绍了Windows系统和Python环境下的安装方法，包括自定义安装路径和模型存储位置的修改。通过命令行或Python SDK可快速运行模型，并提供了简单的对话示例代码。Ollama为本地大模型运行提供了便捷的解决方案，适合不同场景下的应用需求。

开源大模型本地化部署不用ollama

02-13

### 开源大模型本地化部署替代方案 #### 使用 Hugging Face Transformers 和 PyTorch 进行本地部署 Hugging Face 提供了一个强大的库 `transformers`，支持多种预训练的大规模语言模型 (LLMs)，并允许用户轻松地在本地环境中加载和运行这些模型。以下是具体操作：对于 Python 用户来说，在本地 CPU 上启动一个 LLM 可以通过安装必要的依赖项来实现[^1]。 ```bash pip install torch transformers ``` 接着利用如下脚本实例化所需模型并调用其生成功能: ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_name = "facebook/opt-125m" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name) input_text = "Once upon a time," inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(inputs.input_ids, max_length=50) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ``` 此代码片段展示了如何使用 Facebook 的 OPT 模型作为例子；当然也可以替换为其他任何由社区维护和支持的开放访问权版本。 #### Docker 容器化解决方案另一种常见的做法是采用容器编排工具如 Docker 来简化环境配置过程以及跨不同计算资源间的迁移工作负载。官方镜像通常已经包含了执行推理所需的全部组件，只需拉取相应镜像即可快速开始实验[^2]。例如，要基于 NVIDIA NeMo Megatron 部署超大规模自回归解码架构，则可以通过下面命令获取最新发布的 GPU 版本（注意这里假设目标硬件具备兼容 CUDA 设备）: ```bash docker pull nvcr.io/nvidia/pytorch:21.09-py3 ``` 之后按照项目文档指引设置好内部参数后就能顺利开展后续任务了。