基于深度强化学习的分布式组件系统集成实验
在分布式系统中,多个组件之间的有效集成和协同工作是一个关键挑战。本文将介绍一种基于深度强化学习的方法,用于构建能够在有限信息下实现组件间有效控制和交互的系统,并通过一系列实验验证其有效性。
1. 实验环境与设置
所有实验均在同一台配备 Intel® Core™ i5 CPU(2.4 GHz)和 8GB RAM 的计算机上进行,运行 Windows 11 操作系统。采用 Python 语言结合 PyTorch 库实现该方法。
2. 简化模型实验
实验分为两部分,首先对简化模型的六个现有示例进行测试。
- 示例介绍 :
- schedule 示例 :控制器需确保系统不选择动作 a,否则环境会进入 e3 状态,后续无法与 b 成功交互。一个具有两个状态、在 b 和 c 之间交替的控制器,即允许交互序列 (bc)∗,可保证不发生故障。
- cases 示例 :系统初始状态必须提供动作 a,但环境初始只允许 b 或 c,交互会失败。系统保持状态不变,环境根据自身选择进入 e2 或 e3。最优控制器需考虑执行历史,首次提供 a 失败后,再次提供 a 仍失败则选择 c,否则选择 b。
- 实验参数与结果 :
- 之前的实验中,每个示例达到最优结果的超参数值不同,复杂示例和简单示例的训练例程也不同。而本次实验对所有六个示例使用相同的训练例程和一组超参数值。
- 训练过程中,每个优化阶段采样 160 个长度为 25 的情节,
超级会员免费看
订阅专栏 解锁全文
745

被折叠的 条评论
为什么被折叠?



