spark写出分布式的训练算法_基于Spark的分布式机器人强化学习训练框架

基于

Spark

的分布式机器人强化学习训练框架

1,2

,黄增强

3

,徐建斌

4

,黄

羿

1,5

,马新强

1,5

【摘

要】

摘要:强化学习能够通过自主学习的方式对机器人难以利用控制方法

实现的各种任务进行训练完成,有效避免了系统设计人员对系统建模或制定规

则。然而,强化学习在机器人开发应用领域中训练成本高昂,需要花费大量时

间成本、硬件成本实现学习训练,虽然基于仿真可以一定程度减少硬件成本,

但对类似

Gazebo

这样的复杂机器人训练平台,仿真过程工作效率低,数据采

样耗时长。为了有效解决这些问题,针对机器人仿真过程的平台易用性、兼容

性等方面进行优化,提出一种基于

Spark

的分布式强化学习框架,为强化学习

的训练与机器人仿真采样提供分布式支持,具有高兼容性、健壮性的特性。通

过实验数据分析对比,表明本系统框架不仅可有效提高机器人的强化学习模型

训练速度,缩短训练时间花费,且有助于节约硬件成本。

【期刊名称】

《图学学报》

【年

(

),

期】

2019(040)005

【总页数】

6

【关键词】

机器人;强化学习;

Spark

;分布式;数据管道

目前,大多数传统智能机器人系统都是基于精确模型的控制方法,如果实现较

为精准可靠的控制性能则需要花费大量成本预先建立精准模型,且上述机器人

控制模型对于未知环境输入适应性不强。强化学习与传统控制方法相比,无需

建立精准模型,经由大量采样数据训练得到可行的控制模型。但是,强化学习

在模型训练过程中,大量的数据采集需要通过与机器人的交互获得,在使用真

实机器人进行大量数据采样时存在数据获取速度慢、损耗大等问题,特别对于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值