前言:
ray.rllib的算法配置方式有多种,网上的不同教程各不相同,有的互不兼容,本文汇总罗列了多种算法配置方式,给出推荐,并在最后给出可运行代码。
环境配置:
torch==2.5.1
ray==2.10.0
ray[rllib]==2.10.0
ray[tune]==2.10.0
ray[serve]==2.10.0
numpy==1.23.0
python==3.9.18
四种配置方式
方法1
import os
from ray.rllib.algorithms.ppo import PPO,PPOConfig
from ray.tune.logger import pretty_print
## 配置算法
config = PPOConfig()\
.rollouts(num_rollout_workers = 2)\
.resources(num_gpus=0)\
.environment(env="CartPole-v1")
algo = config.build()
缺点:不能在每行配置后面添加注释, 否则报错。

最低0.47元/天 解锁文章
1219

被折叠的 条评论
为什么被折叠?



