论文解读 | 基于蒙特卡罗树搜索的触觉目标识别主动末端执行器姿态选择

原创 | 文 BFT机器人

本论文提出了一种新颖的方法,使用仅触觉来进行主动物体识别。该算法通过蒙特卡罗树搜索来选择最佳的手腕姿态序列进行物体识别。

具体来说,该算法将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。该算法的核心思想是,连续触觉特征与机器人之间的运动相关联。本地特征不是唯一的,会在对称部位和相似曲率处重复。

将它们在物体上离散化会创建共同的特征,可以建模为概率分布,该分布可以在观察和动作的条件下进行建模,而不受大状态空间维数的影响。在物理引擎和真实机器人上进行的实验结果表明,该算法可以在不同的环境中实现高效的物体识别。

图1 左:实验设置。右:一个自适应选择的姿势

01 算法如何选择最佳的姿态序列对物体识别?

该算法通过蒙特卡罗树搜索来选择最佳的手腕姿态序列进行物体识别。具体来说,该算法将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。该算法的核心思想是,连续触觉特征与机器人之间的运动相关联。

本地特征不是唯一的,会在对称部位和相似曲率处重复。将它们在物体上离散化会创建共同的特征,可以建模为概率分布,该分布可以在观察和动作的条件下进行建模,而不受大状态空间维数的影响。

02 <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值