AMD ROCm GPU,支持 TensorFlow!

AMD宣布发布适用于ROCm GPU的TensorFlow v1.8,包括Radeon Instinct MI25的支持。该版本使用MIOpen优化GPU例程库,并提供了预构建的whl软件包及Docker映像简化安装流程。此外,AMD正努力将ROCm的增强功能合并到TensorFlow主存储区。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文 / AMD 深度学习软件总监 Mayank Daga

来源 | TensorFlow 公众号

我们很高兴地宣布推出适用于 ROCm GPU 的 TensorFlow v1.8,其中包括 Radeon Instinct MI25。对于 AMD 正在进行的深度学习加速工作而言,这是一座重大的里程碑。ROCm 即 Radeon 开放生态系统 (Radeon Open Ecosystem),是我们在 Linux 上进行 GPU 计算的开源软件基础。我们的 TensorFlow 实现使用了 MIOpen,这是一个适用于深度学习的高度优化 GPU 例程库。

这里写图片描述

AMD 提供了一个预构建的 whl 软件包,安装过程很简单,类似于安装 Linux 通用 TensorFlow。我们已发布安装说明及预构建的 Docker 映像。

除了支持 TensorFlow v1.8 以外,我们还在努力向 TensorFlow 主存储区加入所有针对 ROCm 的增强功能。其中一些补丁程序已经在上游合并,另外几个正在积极审查中。在努力全面加入增强功能的同时,我们还将发布和维护日后支持 ROCm 的 TensorFlow 版本,例如 v1.10。

我们相信深度学习优化、可移植性和可伸缩性的未来根植于特定领域的编译器。我们受到 XLA 早期结果的启发,也在致力于为 AMD GPU 启用和优化 XLA。

如需进一步了解 AMD 在此领域的工作,请访问 www.amd.com/deeplearning

### 下载支持AMD GPUTensorFlow 目前,官方 TensorFlow 并未提供针对 AMD GPU 的原生支持。主流的支持主要集中在 NVIDIA CUDA 和 cuDNN 技术上[^1]。然而,社区中有若干替代方案可以实现对 AMD GPU支持。 #### 使用 ROCm (Radeon Open Compute) ROCm 是由 AMD 开发的一个开源平台,旨在为高性能计算提供支持。通过此项目,可以在 AMD GPU 上运行深度学习框架,包括 TensorFlow。以下是具体方法: 1. **安装 ROCm 驱动程序** 安装适合操作系统的 ROCm 驱动程序和库文件。可以通过以下命令完成基础环境配置: ```bash sudo apt update && sudo apt upgrade -y wget https://repo.radeon.com/rocm/apt/debian/rocm-gpg-key.pub sudo apt-key add rocm-gpg-key.pub echo 'deb [arch=amd64] https://repo.radeon.com/rocm/apt/debian focal main' | sudo tee /etc/apt/sources.list.d/rocm.list sudo apt update sudo apt install rocm-dev ``` 2. **安装兼容的 TensorFlow 版本** 社区维护了一个基于 ROCmTensorFlow 构建版本。可以直接从 PyPI 或源码编译获取支持 AMD GPUTensorFlow。 ```bash pip install tensorflow-rocm ``` 此外,也可以手动指定特定版本号来匹配 ROCm 环境的需求[^2]。 3. **验证安装成功与否** 运行简单的测试脚本来确认 TensorFlow 是否能够检测到并利用 AMD GPU 资源: ```python import tensorflow as tf gpus = tf.config.experimental.list_physical_devices('GPU') if gpus: try: # 设置内存增长模式以避免占用全部显存 for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True) logical_gpus = tf.config.experimental.list_logical_devices('GPU') print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs") except RuntimeError as e: print(e) else: print("No GPU detected.") ``` #### 替代解决方案:MIOpen 如果希望进一步优化性能表现,则可考虑集成 MIOpen 库至自定义构建流程之中。该库专为加速机器学习工作负载而设计,并且紧密配合 ROCm 生态系统运作良好。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值