Transformers Benchmarks 开源项目教程

最新推荐文章于 2025-05-26 09:00:03 发布

明会泽Irene

最新推荐文章于 2025-05-26 09:00:03 发布

阅读量519

点赞数 15

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00974/article/details/147035178

Transformers Benchmarks 开源项目教程

transformers-benchmarks 项目地址: https://gitcode.com/gh_mirrors/tr/transformers-benchmarks

1. 项目介绍

Transformers Benchmarks 项目旨在为不同类型的 GPU（包括单 GPU、多 GPU 以及多机环境）上的 Transformer 模型训练提供真实的 TeraFLOPS 性能数据。这些数据可以帮助用户估算训练大型 Transformer 模型所需的机器时间。项目考虑了硬件、散热、CUDA 版本、Transformer 模型、批处理大小等超参数和实现方式等多个因素，给出了个人电脑和云实例上的性能数据，并且提供了 Jupyter 笔记本供用户在自机器和工作负载上进行性能测试。

2. 项目快速启动

要运行 Transformers Benchmarks 项目，您需要一个支持 CUDA 的 PyTorch 环境。以下是快速启动的步骤：

首先，确保您的系统已安装了 CUDA 和 PyTorch。推荐使用最新版本的 CUDA 和 PyTorch 以获得更好的性能。

使用 nvidia-docker 来运行 PyTorch 容器是一个简单的方式。安装 nvidia-docker 后，您可以找到 PyTorch 镜像的最新标签，例如 22.07-py3，然后运行以下命令：

sudo docker run --gpus all -it --rm -p 8888:8888 -v ~:/workspace \
--ipc=host --ulimit memlock=-1 --ulimit stack=67108864 \
nvcr.io/nvidia/pytorch:22.07-py3

容器启动后，在容器的 shell 中执行 jupyter notebook 命令以打开笔记本。