
认知科学
文章平均质量分 93
视言
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型时代的具身智能系列专题(二十一)
DPPO是一种用于微调预训练扩散策略的有效算法框架,它结合了策略梯度方法和扩散模型的优势,在各种机器人学习和连续控制任务中表现出了优异的性能。通过实验验证了DPPO在不同基准环境中的有效性,以及其在模拟到真实迁移任务中的强大能力。未来的工作可以进一步探索DPPO在模拟到真实迁移中的应用,特别是在基于视觉的策略预训练于多种不同任务的情况下。此外,研究DPPO如何与其他决策工具相结合,如基于模型的规划和视频预测辅助的决策,也是一个有前景的研究方向。原创 2024-12-01 10:30:00 · 1908 阅读 · 0 评论 -
大模型时代的具身智能系列专题(十八)
Jim Fan 是英伟达高级科学家,他和朱玉可一起,在英伟达内部领导一个新研究小组 ——GEAR,通用具身智能体研究。Jim Fan在斯坦福大学视觉实验室获得了博士学位,师从李飞飞教授。他的研究领域十分广泛,包括了多模态基础模型、强化学习以及计算机视觉,曾实习于谷歌云AI、OpenAI、百度硅谷人工智能实验室等知名组织。原创 2024-11-28 20:00:00 · 1147 阅读 · 0 评论 -
大模型时代的具身智能系列专题(十七)
这篇文章引入了 RoboTwin,它是一个整合了现实世界和合成数据的基准,用于评估双臂机器人,解决了机器人领域专业训练数据严重短缺的问题。数据集是使用 AgileX Robotics 平台开发的,并通过由 Deemos’s Rodin 平台提供支持的生成式数字孪生进行了增强。文章建立了一个便捷的从现实到模拟的管道,只需一张现实世界的 RGB 图像就能生成目标物体和相应场景的 3D 模型。该数据集有效加速了机器人系统的训练,能够使机器人在不同任务中的性能得到提升。原创 2024-11-27 20:00:00 · 1870 阅读 · 0 评论 -
大模型时代的具身智能系列专题(十三)
生成运动模型的最新进展取得了显著成果,使得从文本描述中合成逼真的人体运动成为可能。这些运动学方法虽然在视觉上很有吸引力,但通常会产生不符合物理约束的运动,从而产生阻碍现实世界部署的伪影。为了解决这个问题,我们引入了一种新方法,将运动学生成模型与基于物理的角色控制相结合。我们的方法首先训练一个奖励代理来预测下游不可微分控制任务的性能,提供一个高效且可微分的损失函数。然后,该奖励模型用于微调基线生成模型,确保生成的动作不仅多样化,而且在物理上也适用于现实世界场景。原创 2024-11-21 20:00:00 · 1630 阅读 · 0 评论 -
大模型时代的具身智能系列专题(十二)
Robert Platt是美国东北大学Helping Hands机器人实验室主任、计算机科学教授。原创 2024-11-20 20:00:00 · 1188 阅读 · 0 评论 -
通往自动机器智能的隐变量能量模型(work in progress)
在AI达到类人水平并带来新的技术革新之前,当前的自动化系统仍然有重大的局限性。最理想的情况下,会出现L5自动驾驶、家用机器人、虚拟助理,这些机器人会学习可靠的世界模型,然后进行推理,对复杂的行动序列做出计划。本文引入了基于能力的潜变量模型分层联合嵌入预测架构(H-JEPA)。原创 2023-07-03 09:42:00 · 322 阅读 · 0 评论 -
论智能出现的简约性和自恰性原理(上)
一个理解深度网络的新框架:压缩闭环转录。这个框架包含两个原理:简约性(parsimony)与自洽性/自一致性(self-consistency),分别对应 AI 模型学习过程中的“学习什么”与“如何学习”,被认为是构成人工/自然智能的两大基础。......原创 2022-08-14 08:08:37 · 1126 阅读 · 0 评论 -
论智能出现的简约性和自恰性原理(下)
智能闭环中的视觉图形与决策,智能的学科关联与演进原创 2022-08-18 08:43:04 · 1403 阅读 · 0 评论