Ollama 部署大模型

大叔比较胖

已于 2025-04-22 11:44:52 修改

阅读量314

点赞数 6

CC 4.0 BY-SA版权

分类专栏： LLM学习笔记文章标签： ollama 大语言模型

于 2025-02-20 14:55:54 首次发布

本文链接：https://blog.youkuaiyun.com/corbin_zhang/article/details/145753762

概述

Ollama是一个开源框架，‌专门设计用于在本地运行大型语言模型。‌它的主要特点是将模型权重、‌配置和数据捆绑到一个包中，‌从而优化了设置和配置细节，‌包括GPU使用情况，‌简化了在本地运行大型模型的过程，采用WSL2作为运行环境。WSL2是WINDOWS的Linux虚拟机，此案例使用的是Ubuntu 22.04.3 LTS (GNU/Linux 5.15.167.4-microsoft-standard-WSL2 x86_64)版本系统

安装

curl -fsSL https://ollama.com/install.sh | sh
sudo chmod +x /usr/bin/ollama

运行（当前使用qwen1.5的模型）

此模型4.7G，下载会比较慢，不要中断，不要中断，不要中断！！！

ollama run qwen:7b

后台启动

# 修改ollama的service文件：/etc/systemd/system/ollama.service
# 在[Service]下边增加一行：Environment="OLLAMA_HOST=0.0.0.0:11434"，端口根据实际情况修改
systemctl daemon-reload
systemctl stop ollama
systemctl start ollama
systemctl status ollama

启动WEBUI

前置条件，本地已安装Docker。执行命令后，通过浏览器访问http://localhost:8080即可打开页面。

命令中192.168.0.216为本机IP地址

docker run -d -p 8080:8080 -e OLLAMA_BASE_URL=http://1

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大叔比较胖

关注关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

报错：anythingllm无法导入文件，显示Error: 1 documents failed to add. Ollama Failed to embed: fetch failed...如何解决

**My Coding Family**

05-10

832

🏆 本文收录于《全栈Bug调优(实战版)》专栏，致力于分享我在项目实战过程中遇到的各类Bug及其原因，并提供切实有效的解决方案。无论你是初学者还是经验丰富的开发者，本文将为你指引出一条更高效的Bug修复之路，助你早日登顶，迈向财富自由的梦想🚀！同时，欢迎大家关注、收藏、订阅本专栏，更多精彩内容正在持续更新中。让我们一起进步，Up！Up！Up！备注：部分问题/难题源自互联网，经过精心筛选和整理，结合数位十多年大厂实战经验资深大佬经验总结所得，数条可行方案供所需之人参考。

ElasticSearch中使用bge-large-zh-v1.5进行向量检索（一）

zhujiahui622的专栏

04-12

1万+

ElasticSearch中使用bge-large-zh-v1.5进行向量检索

参与评论您还未登录，请先登录后发表或查看评论

LightRAG成功跑通：Ollama+Qwen2.5+bge-large-zh-v1.5

最新发布

topfine的博客

04-11

1367

Ollama的优势在哪里? 如何启动Ollama 配置适合自己Ollama 加载本地模型的方法

使用Docker+ollama部署大模型

m0_64636251的博客

08-04

8245

使用Docker+ollama部署大模型 ，包括docker和ollama安装配置，以及大模型部署实例

如何使用Ollama部署大模型

这里面的代码全是错的

02-07

1633

Ollama是一个专为在本地环境中运行和定制大型语言模型而设计的工具。它提供了一个简单而高效的接口，用于创建、运行和管理这些模型，同时还提供了一个丰富的预构建模型库，可以轻松集成到各种应用程序中。Ollama的目标是使大型语言模型的部署和交互变得简单，无论是对于开发者还是对于终端用户。Ollama提供了一个直观且用户友好的平台，用于在本地环境中运行大型语言模型。首先，确保Ollama服务已经安装并运行。在命令行中输入ollama start以启动服务。

五分钟使用ollama部署本地大模型

zwl2220943286的博客

04-07

1230

五分钟使用ollama安装部署本地大模型

Eland上传bge-large-zh-v1.5向量化模型到ElasticSearch中

zhujiahui622的专栏

04-11

3557

Eland上传bge-large-zh-v1.5向量化模型到ElasticSearch中。

Error raised by inference API HTTP code: 404, {“error“:“model \“quentinz/bge-large-zh-v1.5\“ not fou

Mooczx的博客

09-28

1699

按照chatchat文档走,在ollama中拉去向量模型ollama pull quentinz/bge-large-zh-v1.5即可,在model_settings.yaml修改。

简单编码方式构建大模型知识库

u013220851的博客

07-28

1719

知识库构建需要一个大模型这里选用ollama可以选用qwen2模型，其次我们需要知识的检索跟知识的排序，部署xinference平台。图中的流程几乎都在调用http，只是做简单的逻辑梳理就能通过编码的方式来构建了知识库，在此基础上我们可以更加深入的进行业务调整。本文只用到http相互调用来构建知识库。只需要简单的python基础。embedding就是向量，转成向量后的数据可以保存到数据库中，通过编码的方式如faiss来进行向量查询来比对最相似的，如下代码就是通过模拟一组数据然后通过向量进行查询。

langchain实战-基于ollama+deepseek+bge-large-zh组合开发本地知识库

AI agent

03-17

1176

使用langchain框架，基于ollama+deepseek+bge-large-zh组合开发本地知识库

在使用OllamaEmbeddings时，报错ollama._types.ResponseError

qq_56942824的博客

08-26

2828

最近在部署RAG+Ollama时，在使用OllamaEmbeddings时，报错ollama._types.ResponseError。又重新安装了一次解决。

使用ollama部署大模型怎么样

04-10

<think>嗯，用户问的是如何使用Ollama部署大模型，以及相关的教程和最佳实践。首先，我需要确认用户的需求。他们可能已经对Ollama有基本的了解，但需要具体的步骤指导。根据提供的引用，Ollama是一个简化本地部署大模型的工具，用户可以通过几条命令运行如Llama 2这样的模型。首先，我需要整理安装步骤。用户可能是在不同的操作系统上使用，所以得包括Linux/macOS和Windows的安装方法。对于Linux/macOS，使用curl命令下载安装脚本，而Windows用户可能需要访问官网下载安装包。这部分要明确，避免混淆。接下来是基础使用部分。用户需要知道如何拉取模型，比如ollama pull llama2，然后运行它。可能还需要解释不同模型变体的区别，比如7b、13b参数版本，以及是否有聊天优化的版本。这部分需要简明扼要，让用户能够快速上手。然后，微调模型的部分引用了用户提供的资料，使用ollama train命令，但用户可能不清楚具体的数据集格式和操作步骤。需要补充说明数据集应该是JSON文件，结构如何，可能还需要示例代码，比如生成数据集的方式。这样用户能更直观地理解如何准备数据。高级功能部分，多模态支持可能对用户有用，但需要确认Ollama是否支持。根据引用[1]，确实提到了多模态模型支持，所以可以建议用户查阅官方文档。此外，REST API整合到Spring Boot也是一个用户可能关心的点，引用[2]提到了整合Spring Boot，所以需要提供如何调用API的示例，比如使用curl命令和Java代码示例，帮助开发者进行集成。最佳实践部分，用户需要知道如何选择适合的模型，资源监控，版本管理和数据准备。比如根据硬件选择模型大小，使用htop或nvidia-smi监控资源，定期更新模型版本，以及确保数据质量。这些都是实际使用中常见的问题，需要给出具体建议。最后，相关教程资源部分，官方文档、社区论坛和GitHub仓库都是重要的信息来源。需要提供链接或指引，让用户能进一步查阅。在回答过程中，需要保持结构清晰，分步骤说明，确保用户能逐步跟随操作。同时，注意使用中文，避免专业术语过多，必要时进行解释。例如，解释“微调”是指对预训练模型进行特定任务的调整，提升性能。还要检查所有命令的正确性，比如ollama run llama2是否正确，是否需要额外参数。可能用户还会遇到问题，比如安装失败、模型无法下载或运行错误。虽然用户没有直接提问，但在最佳实践中可以加入常见问题解决，比如网络问题或资源不足的建议。此外，引用标识要正确对应，比如引用[^1]和[^2]的来源，确保信息准确。总结来说，回答需要涵盖安装、基础使用、微调、高级功能、最佳实践和教程资源，结构分明，步骤详细，示例实用，同时引用提供的资料来增强可信度。还要预判用户可能遇到的问题，提前给出解决方案，确保回答全面有用。</think># 如何使用Ollama部署大模型 ## 一、环境准备与安装 1. **Linux/macOS安装** ```bash curl -fsSL https://ollama.ai/install.sh | sh ``` 2. **Windows安装** 访问[Ollama官网](https://ollama.ai)下载安装包，双击执行安装程序 ## 二、基础使用 1. **拉取预训练模型** ```bash ollama pull llama2 # 下载Llama 2基础模型 ollama pull mistral # 下载Mistral开源模型 ``` 2. **运行模型交互** ```bash ollama run llama2 ``` 支持选择不同参数版本： ```bash ollama run llama2:7b # 70亿参数版本 ollama run llama2:13b # 130亿参数版本 ollama run llama2-chat # 对话优化版本 ``` ## 三、模型微调（引用[^1]） 1. **准备训练数据集** 创建JSON格式数据集文件： ```json [ {"input": "什么是机器学习", "output": "机器学习是..."}, {"input": "解释神经网络", "output": "神经网络是..."} ] ``` 2. **执行微调训练** ```bash ollama train my_custom_model --dataset ./training_data.json ``` ## 四、高级功能 1. **多模态支持** 支持图像+文本联合输入： ```bash ollama run llava # 多模态模型示例 ``` 2. **API集成（引用[^2]）** Spring Boot集成示例： ```java // 调用Ollama API RestTemplate restTemplate = new RestTemplate(); String response = restTemplate.postForObject( "http://localhost:11434/api/generate", new RequestBody("为什么天空是蓝色的"), String.class ); ``` ## 五、最佳实践 1. **硬件适配建议** - 8GB内存设备：使用<=7B参数模型 - 16GB内存设备：可运行13B参数模型 - GPU加速：安装NVIDIA驱动+CUDA工具包 2. **性能优化技巧** ```bash ollama run llama2 --num-gpu-layers 32 # GPU加速层数设置 ollama run mistral --temperature 0.7 # 输出随机性控制 ``` 3. **运维管理** - 监控资源使用：`watch -n 1 ollama stats` - 模型版本管理： ```bash ollama list # 查看已安装模型 ollama rm llama2 # 删除旧版本 ``` ## 六、教程资源 1. 官方文档：https://ollama.ai/docs 2. 社区论坛：https://github.com/ollama/ollama/discussions 3. 示例项目库：https://github.com/ollama/workshops