GPUStack v0.4：文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型

Seal软件

于 2024-12-09 09:41:39 发布

阅读量1.4k

点赞数 29

CC 4.0 BY-SA版权

文章标签：人工智能 AIGC 自然语言处理语言模型 stable diffusion AudioLM

本文链接：https://blog.youkuaiyun.com/SEAL_Security/article/details/144338380

GPUStack 是一个专为运行 AI 模型设计的开源 GPU 集群管理器，致力于支持基于任何品牌的异构 GPU 构建统一管理的算力集群。无论这些 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上，GPUStack 都能将它们纳入统一的算力集群中。管理员可以轻松地从 Hugging Face 等流行的模型仓库中部署 AI 模型，开发人员则能够通过 OpenAI 兼容的 API 访问这些私有模型服务，就像使用 OpenAI 或 Microsoft Azure 提供的公共模型服务 API 一样便捷。

随着越来越多的用户在 RAG、AI Agents 和其他多样化场景中应用 GPUStack，用户需求不断增加。基于用户的高优先级需求，我们推出了功能强大的 GPUStack v0.4 版本。

GPUStack v0.4 版本的核心更新包括：

新增三种模型类型支持：文生图模型、Speech-to-Text（STT）语音模型和 Text-to-Speech（TTS）语音模型。
推理引擎版本管理：支持为每个模型固定任意推理引擎版本。
新增 Playground UI：提供 STT、TTS、文生图、Embedding 和 Rerank 的 Playground 调试 UI。
离线支持：支持离线安装、离线容器镜像及离线部署本地模型。
扩展兼容性：进一步扩展了对操作系统的支持，包括一些遗留操作系统和国产操作系统。
问题修复与优化：针对社区用户反馈的问题进行了大量改进和增强。

这一版本提升了 GPUStack 的适用性和稳定性，更好地满足多样化的使用需求。

有关 GPUStack 的详细信息，可以访问：

GitHub 仓库地址: https://github.com/gpustack/gpustack

GPUStack 用户文档: https://docs.gpustack.ai

重点特性介绍

支持文生图模型

GPUStack 新增了对文生图模型的支持！在 llama-box 推理引擎中，我们集成了 stable-diffusion.cpp，从而实现对文生图模型的支持，我们还提供了对 昇腾 NPU 和 摩尔线程 GPU 的支持。GPUStack 可以运行在 Linux、macOS 和 Windows 操作系统上，利用 NVIDIA GPU、Apple Metal GPU、昇腾 NPU 和 摩尔线程 GPU 来运行 Stable Diffusion、FLUX 等文生图模型。

此外，我们还提供了经过调优的 All-in-one 文生图模型，模型列表可查看：

https://huggingface.co/collections/gpustack/image-672dafeb2fa0d02dbe2539a9

支持语音模型

GPUStack 新增了对语音模型的支持！我们推出了语音模型推理引擎 vox-box [ https://github.com/gpustack/vox-box ]，vox-box 是一个支持推理 Text To Speech 和 Speech To Text 模型并提供 OpenAI API 的推理引擎，目前对接了 Whisper、FunASR、Bark 和 CosyVoice 后端。