RDT-1B: A DIFFUSION FOUNDATION MODEL FORBIMANUAL MANIPULATION

最新推荐文章于 2025-06-14 22:22:37 发布

Ming_Chs

最新推荐文章于 2025-06-14 22:22:37 发布

阅读量1k

点赞数 23

CC 4.0 BY-SA版权

分类专栏：具身智能文章文章标签：人工智能深度学习机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/s_m_c/article/details/144374901

发表时间：arxiv Oct 2024

论文链接：ReadPaper

作者单位：Tsinghua University

Motivation：Bimanual manipulation is essential in robotics, yet developing foundation models is extremely challenging due to the inherent complexity of coordinating two robot arms (leading to multi-modal action distributions) and the scarcity of training data. （也是从数据稀缺的角度切入）

解决方法：RDT建立在扩散模型的基础上，有效地表示多模态，具有可扩展的Transformer的创新设计来处理多模态输入的异质性，并捕获机器人数据的非线性和高频。为了解决数据稀缺问题，我们进一步引入了一个物理可解释的统一动作空间，它可以统一各种机器人的动作表示，同时保留原始动作的物理含义，促进学习可转移的物理知识。

统一的动作空间是如何定义的？是如何促进学习可转移的物理知识的？

是一个256维度的向量。（为了进一步使在异构数据上训练 RDT，我们提出了物理可解释的统一动作空间，这是各种带有夹持器臂的机器人的统一动作格式。这种创新的格式减轻了不同机器人之间的潜在冲突，同时保留了原始动作的物理含义，这可以促进模型学习跨不同机器人数据集的可泛化物理知识。）

是当时发表的

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ming_Chs 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。