论文阅读笔记——RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION

最新推荐文章于 2025-12-06 20:25:44 发布

原创

最新推荐文章于 2025-12-06 20:25:44 发布 · 1.5k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读 #笔记 #具身智能 #双壁机器人 #扩散模型

RDT-1B 论文
模型表达与泛化能力：由于双臂操作中动作空间维度是单臂空间的两倍，传统方法难以建模其多模态分布。
数据：双臂数据少且不同机器人的物理结构和动作空间差异（如关节数、运动范围）导致数据分布不一致，直接合并训练可能引发负迁移（negative transfer）。

负迁移是迁移学习（Transfer Learning）中的一种现象，指在将一个领域（或任务）的知识迁移到另一个领域（或任务）时，由于源域（source domain）和目标域（target domain）之间的差异过大或不匹配，导致迁移后的模型性能反而比不迁移时更差。

研究的是基于语言指令的双臂视觉操作。
给定一条语言指令 $\mathcal{l}$ ，策略接受在时间 $t\in\mathbb{N}^+$ 的观测 $o_t$ ，输出动作 $a_t$ 。观测 $o_t:={X_{t-T_{img}+1:t+1},z_t,c}$ 其中 $X_{t-T_{img}+1:t+1}:=\{X_{t-T_{img}+1},……,X_t\}$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

寻丶幽风

关注关注

23
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation

mikhailbran的博客

05-19

1161

RDT-1B这里有个端侧模型,有很多创新点, 且主要是开源, 所以这里进行学习和探究。

论文阅读:RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION

yumu1890的博客

06-14

1369

双臂操作在机器人领域中至关重要，但由于协调两只机械臂本身具有高度复杂性（导致动作分布呈多模态），再加上训练数据的稀缺性，开发基础模型极具挑战性。在本文中，文章提出了机器人扩散变换器（Robotics Diffusion Transformer, RDT），这是首个专为双臂操作设计的扩散式基础模型。RDT 基于扩散模型，有效建模多模态特征，并通过创新设计的一种可扩展的 Transformer 结构，处理多模态输入的异质性，捕捉机器人数据中的非线性特性和高频变化。为了解决数据稀缺问题，文章进一步引入了。

参与评论您还未登录，请先登录后发表或查看评论

1 条评论

优快云-Ada助手 2025.04.06
你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。