智能城市中的强化学习应用:交通控制、电网辅助服务与网络攻击检测
1. 交通灯控制优化车辆流量
使用 RLlib 解决交通控制问题,需要借助其多智能体接口,具体操作步骤如下:
1. 在 RLlib 中使用名称和环境创建函数注册环境。
2. 定义要训练的策略名称,这里只有一个策略“tlight”。
3. 定义一个函数,为 RLlib 训练器生成策略所需的参数。
4. 定义一个函数,将智能体映射到策略,由于所有智能体都映射到相同策略,此步骤较为简单。
以下是实现上述步骤的代码:
create_env, env_name = make_create_env(params=flow_params,
version=0)
register_env(env_name, create_env)
test_env = create_env()
obs_space = test_env.observation_space
act_space = test_env.action_space
def gen_policy():
return PPOTFPolicy, obs_space, act_space, {}
def policy_mapping_fn(_):
return 'tlight'
policy_graphs = {'tlight': gen_policy()}
policies_to_train = ['tlight']
定义完成后,需要将这些函数和列表
超级会员免费看
订阅专栏 解锁全文
544

被折叠的 条评论
为什么被折叠?



