假肢人工智能挑战解决方案:多策略深度强化学习探索
1. 基于 GPU - CPU 多进程的深度强化学习
在假肢人工智能的研究中,面临的一个主要挑战是模拟运行非常消耗 CPU 资源,而训练神经网络的最佳计算设备是 GPU。为解决此问题,有两种方法:一是构建具有合适 GPU - CPU 比例的定制机器,避免出现瓶颈;二是让 GPU 机器(如 AWS 加速计算实例)与 CPU 机器(如 AWS 计算优化实例)协同工作。
- 训练框架 :训练框架分为客户端和服务器端。客户端(GPU 实例)根据从服务器(CPU 实例)接收的数据训练模型。服务器端启动多个封装在 HTTP 服务器中的真实环境来运行物理模拟,客户端启动相应数量的虚拟环境,将请求重定向到 OpenSim 环境。虚拟环境将状态(排队)传输给模型工作者,模型工作者处理状态并输出动作。模型工作者的网络通过共享内存由训练器不断更新,采样器处理完整的情节并生成一批数据供训练器训练演员和评论家网络。
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(服务器端 - CPU 实例):::process -->|传输数据| B(客户端 - GPU 实例):::process
A --> C(真实环境 - HTTP 服务器):::process
B --> D(虚拟环境 - OpenSim):::process
D --> E(模型工作者):::process
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



