挂载外部存储中的模型文件来运行大模型的容器镜像

最新推荐文章于 2025-12-14 14:48:42 发布

原创

最新推荐文章于 2025-12-14 14:48:42 发布 · 1k 阅读

·

22

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

🧩 一、Ollama 系列镜像

核心能力：专为运行大模型设计的工具链，提供 API 服务，支持 GGUF 等格式模型直接加载
存储兼容性：支持挂载 NAS、CFS、NFS 等共享存储，模型文件独立于镜像
镜像示例：

基础镜像：ollama/ollama:latest

自定义镜像：集成模型文件与启动脚本（通过 Modelfile 定义模型参数）
部署流程：

将模型文件（如 qwen-7b-q4_k_m.gguf）放入共享存储路径（如 /mnt/models）

创建 PVC 挂载到容器内目录（如 /root/.ollama/models）

启动容器时自动加载模型并暴露 API 端口（默认 11434）
适用场景：快速部署开源大模型（如 LLaMA、Qwen、DeepSeek），支持轻量化 API 交互

🤗 二、Hugging Face Transformers 官方镜像

核心能力：原生支持加载 Hugging Face Hub 或本地路径的模型
镜像示例：

nvcr.io/nvidia/pytorch:23.10-py3（NVIDIA 优化）

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。