Any2Policy: Learning Visuomotor Policy with Any-Modality（类似AnyGPT）

Ming_Chens

于 2024-12-12 09:15:58 发布

阅读量620

点赞数 4

CC 4.0 BY-SA版权

分类专栏：具身智能文章文章标签：深度学习机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/s_m_c/article/details/144416061

发表时间：NeurIPS 2024

论文链接：https://readpaper.com/pdf-annotate/note?pdfId=2598959255168534016&noteId=2598960522854466816

作者单位：Midea Group

Motivation：Current robotic learning methodologies often focus on single-modal task specification and observation, thereby limiting their ability to process rich multi-modal information.（从多模态的角度切入）

Any2Policy 框架旨在处理多模态输入，分别在指令和观察级别单独或串联容纳它们。

我们设计了嵌入式对齐模块，旨在同步不同模态之间的特征，以及指令和观察，确保不同输入类型的无缝和有效的集成。

解决方法：为了解决这一限制，我们提出了一个名为 Any-to-Policy Embodied Agents 的端到端通用多模态系统。该系统使机器人能够使用各种模式处理任务，无论是在文本图像、音频图像、文本点云等组合中。

实现方式：我们的创新方法包括训练一个通用模态网络，该网络适应各种输入，并与策略网络连接以进行有效控制。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ming_Chens 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。