使用Optimum-habana对LLM模型训练推理

最新推荐文章于 2026-01-09 16:00:52 发布

原创

最新推荐文章于 2026-01-09 16:00:52 发布 · 1.1k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

optimum-habana 是 Transformers 和 Diffusers 库与 Intel Gaudi AI 加速器（HPU）之间的接口。它提供了一套工具，可轻松在单 HPU 和多 HPU 环境下针对不同下游任务进行模型加载、训练和推理。用户只需稍作修改，就可以在 Intel Gaudi 加速器上尝试数千个 Hugging Face 模型和相关任务。

1、官方已验证的模型和任务列表：

Transformers:

Architecture	Training	Inference	Tasks
BERT	✔️	✔️	text classification question answering language modeling text feature extraction
RoBERTa	✔️	✔️	question answering language modeling
ALBERT	✔️	✔️	question answering language modeling
DistilBERT	✔️	✔️	question answering language modeling
GPT2	✔️	✔️	language modeling text generation
BLOOM(Z)		DeepSpeed	text generation
StarCoder / StarCoder2	✔️	Single-card	language modeling text generation
GPT-J	DeepSpeed	Single cardDeepSpeed	language modeling text generation
GPT-Neo		Single card	text generation
GPT-NeoX	DeepSpeed	DeepSpeed	language modeling text generation
OPT		DeepSpeed	text generation
Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite	✔️	✔️	language modeling text generation question answering text classification (Llama Guard)
StableLM		Single card	text generation
Falcon	LoRA	✔️	language modeling text generation
CodeGen		Single card	text generation
MPT		Single card