Felafax 使用教程

原创于 2025-04-04 10:10:39 发布 · 629 阅读

CC 4.0 BY-SA版权

Felafax 使用教程

felafax Felafax is building AI infra for non-NVIDIA GPUs 项目地址: https://gitcode.com/gh_mirrors/fe/felafax

1. 项目介绍

Felafax 是一个开源框架，旨在为非 NVIDIA 硬件（如 TPU、AWS Trainium、AMD GPU 和 Intel GPU）运行 AI 工作负载提供便利。该项目支持持续训练和微调开源的大型语言模型（LLM），使用 XLA 运行时来提高性能。Felafax 提供了即插即用的 Jupyter 笔记本，用户可以轻松开始训练任务，并且可以轻松配置训练的所有方面，支持从单个 TPU VM 到拥有 6000 个 TPU 核心的 TPU Pod 的无缝扩展。

2. 项目快速启动

以下是 Felafax 的快速启动指南：

首先，确保你已经安装了必要的依赖：

pip install pipx
pipx install felafax-cli

然后，生成一个认证令牌并登录：

# 访问 preview.felafax.ai 并创建/登录你的账户
# 导航到 Tokens 页面并创建一个新令牌
# 使用你的令牌认证 CLI 会话
felafax-cli auth login --token <your_token>

接下来，初始化微调配置文件：

felafax-cli tune init-config

更新配置文件，设置你的超参数，例如批量大小、序列长度、学习率和 LoRA 排名等。

最后，开始微调过程：

# 列出可用的基础模型
felafax-cli tune start --help

# 选择一个模型并开始微调
felafax-cli tune start --model <your_selected_model> --config ./config.yml --hf-dataset-id <your_hf_dataset_name>

3. 应用案例和最佳实践

案例一：使用 Felafax 在 Google Colab 的免费 TPU 资源上微调 LLaMa-3.1 模型。
- 步骤：添加你的数据集，点击“运行全部”，即可开始微调。
案例二：在 AMD MI300x GPU 上使用 JAX 微调 llama3.1 405B 模型。
- 步骤：按照配置文件设置相应的参数，使用 JAX 的分片 API 进行性能优化。

最佳实践：