ray.rllib 入门实践-2：配置算法

原创

已于 2025-01-26 08:03:55 修改 · 923 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python #rllib

于 2025-01-24 21:14:35 首次发布

前言：

ray.rllib的算法配置方式有多种，网上的不同教程各不相同，有的互不兼容，本文汇总罗列了多种算法配置方式，给出推荐，并在最后给出可运行代码。

环境配置：

torch==2.5.1

ray==2.10.0

ray[rllib]==2.10.0

ray[tune]==2.10.0

ray[serve]==2.10.0

numpy==1.23.0

python==3.9.18

四种配置方式

方法1

import os 
from ray.rllib.algorithms.ppo import PPO,PPOConfig
from ray.tune.logger import pretty_print

## 配置算法
config = PPOConfig()\
        .rollouts(num_rollout_workers = 2)\
        .resources(num_gpus=0)\
        .environment(env="CartPole-v1")
algo = config.build()

缺点：不能在每行配置后面添加注释，否则报错。