• 博客(1372)
  • 收藏
  • 关注

转载 社区福利|与30+位创始人共聚智源具身OpenDay

本次活动汇聚银河通用、智元机器人、星海图、加速进化、自变量、星源智、原力灵机、因时机器人、松灵机器人、北京人形机器人创新中心、无界动力等40余家前沿团队及智源的合作伙伴们,将集中展示人形机器人及产业融合创新成果。中国联通、中国移动、优必选、海信、软通天擎、招商局集团等领军企业的深度参与,更彰显具身智能驱动实体经济的巨大潜力。罗剑岚 | 智元机器人合伙人、首席科学家,上海创智学院导师。王 鹤丨北京大学助理教授,银河通用创始人及首席技术官。OpenDay,与具身生态同行,与未来交手。

2025-11-19 14:01:16 75

转载 会议通知|CAAI社会计算青年科学家大会(CAAI SCYS2025)即将在北京智源研究院举办

国务院《关于深入实施“人工智能+”行动的意见》明确提出“创新哲学社会科学研究方法”、“超常规构建领军人才培养新模式”、“给予青年人才更大施展空间”等指导,鼓励广大科研人员勇闯人工智能“无人区”。”即将在北京智源人工智能研究院(智源大厦)举行,汇聚社会计算交叉学科领域青年领军人才力量,聚焦社会计算领域的十大关键科学问题,围绕“韧性智能社会”的核心要素与人才体系建设展开深入研讨。发布《社会计算青年战略研究报告》,邀请人工智能领域资深专家分享,为青年学者拓展技术洞察力、社会感知力,提升战略视野。

2025-11-19 14:01:16 25

转载 智能是什么?AGI溯源,重读所罗门诺夫丨品读经典第1期

关于智能是什么的话题,也逐渐有了更多讨论。有人说智能就是压缩,也有人说智能就是学习,还有人说 LLM 不能产生 AGI。然而,所有这些观点,都能追溯到一个统一的源头,那就是柯尔莫哥洛夫复杂度,以及所罗门诺夫归纳。在当前这个时间点,回顾所罗门诺夫的经典工作正当其时。我们仔细探寻,会发现其中蕴涵了丰富的宝藏——从压缩与智能的关系,到强化学习、正则化技巧,乃至持续学习,都能从这些经典工作之中汲取灵感。本期「里程碑论文共读」阅读「所罗门诺夫的经典工作。

2025-11-04 18:22:18 47

原创 哈佛Yilun Du专访:世界模型三问 —— 因果、规划与泛化的征途丨智源独家

比如 Marvin Minsky 撰写的《Steps Towards Artificial Intelligence》,若你细细品读便会发现,如今学界研究的几乎每一个方向,文中都曾提及 —— 他不仅探讨了神经网络的学习方法,还阐述了强化学习、搜索规划的实现路径,以及记忆机制的构建思路。这正是能量基模型的优势所在,即可以通过控制采样时间,提升生成结果的质量。那时候80%的人在做强化学习,20%的人在做各种深度生成模型,比如语言模型或者我们当时在做的能量基模型,和现在的OpenAI很不一样,规模真的很小。

2025-11-03 12:01:33 691

转载 全球 PyTorch 大会与 Triton 大会揭示:算子语言繁荣和分化背后,编译器日益核心

之前,我们关注的是底层 AI 芯片生态(“南向生态”)的割裂问题,因此 FlagOS 社区基于 Triton 编译器技术,打造了更为强大的 FlagTree 编译器,使得广大 Triton 开发者的算法可以通过 FlagTree 运行在多种 AI 芯片上(超过20种),逐步解决了底层芯片后端生态的分裂问题。Gluon 是由 OpenAI 团队开发的更低层级的领域特定语言(DSL),为高级开发者提供更细粒度操作硬件特性的方式,在保持易用性的同时,极致挖掘硬件性能。

2025-10-31 14:51:19 96

转载 智源TALK|ICCV2025最佳论文「马尔奖」从文本生成物理稳定且可搭建的积木结构

随后,我们提出了一个端到端的文本到3D生成流程,能够同时生成3D资产的几何与纹理。在几何生成方面,我们提出了一种基于八叉树的自适应标记方案,它能根据形状复杂度分配表示能力,从而实现更高保真度且更高效的3D形状重建与生成。在外观建模方面,我们利用数据与扩散模型先验,通过文本输入在网格上生成可重新打光的纹理,确保生成的3D对象能在下游生产流程中直接使用。最后,为了使数字设计与现实世界接轨,我们引入了BrickGPT,它融合了制造与物理约束,能够根据文本提示生成物理结构稳定且可实际搭建的积木结构。

2025-10-29 12:41:27 41

转载 青源会首尔话具身前沿,携手清华AIR实验室共筑对话桥梁

此次闭门派对便依托这一学术平台,汇聚来自美国、英国、德国、瑞士、新加坡、中国香港等地的 50 余位学者,大家围绕具身智能和机器人领域前沿技术发展与未来趋势,结合 CoRL 大会期间的所见所感展开深度交流——既分享技术突破、探讨科研转化路径,也在思想碰撞中凝聚行业发展共识,注入新思路。来自美国顶尖科技公司专家、中国香港知名学府科研带头人、明星创企创始人等,纷纷结合 CoRL 大会的参会经历,分享各自关注的前沿学术动态、印象深刻的技术成果,围绕当前热点议题展开热烈探讨,现场观点交锋不断,屡屡迸发新的思考火花。

2025-10-13 12:15:45 46

转载 智源TALK|懂人心才叫真智能,“知人者智”:以用户为中心的智能体交互与训练

钱成,伊利诺伊大学香槟分校 (UIUC) 二年级博士生,导师为季姮教授。曾在 ACL,EMNLP,COLM,COLING,NAACL,ICLR 等多个学术会议发表论文十余篇,一作及共一论文十余篇,谷歌学术引用超 1000,现担任 ACL, EMNLP Area Chair,以及 AAAI,EMNLP,Neurips,COLM 等多个会议 Reviewer。UserBench 最标志性的设计,是旅行规划任务,覆盖五个子场景,每个场景都设有数十条隐式偏好表述,例如“行程很紧”就暗含“直飞/少中转”的飞行偏好。

2025-10-13 12:15:45 71

转载 智源TALK|清华RL最新报告114页,如何将算力更高效地转化为推理智能

从基于人类反馈的强化学习(RLHF)到可验证奖励的强化学习(RLVR),RL 不断推动大语言模型从单纯的指令遵循迈向深度推理,即演进为大型推理模型(LRMs)。本报告将围绕我们最新发布的大模型推理能力强化学习综述,详细阐述 RL for LRMs 的基础框架、前沿问题、训练资源与应用场景,以及未来面临的挑战。我们特别关注大模型与环境在长期进化过程中的交互与学习机制,希望为“如何将算力更高效地转化为推理智能”这一本质问题,带来新的思考与启发。👆扫码报名👆或者点击「阅读原文」报名。

2025-10-13 12:15:45 75

转载 推动具身智能走出实验室,具身大模型挑战赛火热报名中!

这里不仅是比拼模型实力的竞技场,更是展示创意与才华的舞台。让我们一起突破边界,提升模型能力,推动具身智能。2025 第二届中关村具身智能机器人应用大赛。走出实验室,走进现实世界,创造真正的价值!智源具身智能模型能力挑战赛火热报名中!「具身引智 · 应用未来」汇聚尖端技术与产业应用。欢迎大家踊跃报名参赛!未来已来,等你出发!

2025-09-29 12:36:17 77

转载 2025智源学者资助计划启动

人工智能是新一轮科技革命的核心力量,像水、电力一样,产生的智力逐步基础设施化,推动着千行百业产生深刻的变革。他们在人工智能数理基础、认知神经基础、机器学习、自然语言处理、信息检索与挖掘、智能系统架构等关键方向不断突破,持续拓展着世界人工智能的科研版图。这里,还孕育出一批具有原始创新能力的人工智能企业,释放出澎湃的创新力量。,如多模态模型、世界模型、具身大脑、下一代类脑框架、AI安全、AI与科学技术工程等领域的交叉创新;优质算力支持,高质量数据集,自研开源算法体系,工程框架平台,专业科研设备。

2025-09-23 15:41:17 128

原创 线下活动报名|智源具身智能新基建Workshop

地点:智源大厦一层报告厅(北京市海淀区成府路150号)9月24日(周三)下午,北京智源人工智能研究院将举办。时间:2025年9月24日 14:00-17:30。,带您了解智源具身智能领域最新的工作进展。欢迎扫码报名,共同探索具身智能的未来!具身智能新基建Workshop。

2025-09-16 12:02:06 421

原创 专访澳洲院士Toby Walsh:AI 终将领跑数学与科学,但人类艺术创造力难以替代丨智源独家

在他看来,艺术创造力的核心在于 “人类处境”—— 坠入爱河的甜蜜、失去挚爱的痛苦、对生死永恒的思考,这些人类独有的真实体验,是 AI 永远无法拥有的。我觉得这是 AI 系统带来的一个全新伦理挑战,因为 AI 可能具有显著的自主性,能在有限或没有人类监督的情况下做决策,像自动驾驶汽车、自主武器。我认为这一点是非常重要的,作为学术上的建议,不仅适用于当下的 AI 领域,也适用于任何年轻人的学术生涯,那就是你要确保自己在某一方面是有名的。我也意识到,作为一名科学家,向公众传递相关信息,参与这场讨论,至关重要。

2025-09-16 12:02:06 918

转载 智源研究院携手联合国、GOSIM共同举办“可持续发展大会”,凝聚全球开源力量共探AI普惠全球

Mehdi Snene 博士是联合国秘书长数字与新兴技术特使的高级顾问,也是联合国数字与新兴技术办公室的成员,负责领导人工智能能力建设、数字公共基础设施和新兴技术的全球倡议。大会的一大特色是“展示与分享”(Show & Tell)环节,将重点介绍已经为联合国可持续发展目标做出贡献的实际用例和开源项目,将对话转化为切实参与的灵感。涵盖了人类社会发展的方方面面,从消除贫困与饥饿,到应对气候行动、实现和平与正义。发起一个项目,促进开放数据的获取和使用,从而实现基于证据的创新与协作,以推动可持续发展目标的实现。

2025-09-11 15:03:54 134

原创 青源会香江谱新章:香港青源会成立,链接全球资源推动 AI 科研转化

面向未来,香港青源会将结合香港的优势领域,聚焦科研成果的应用与转化,链接全球人工智能青年人才,为学者提供从科研创新到成果落地的全周期支持。他指出,在智能时代到来的历史性机遇下,希望香港青源会能成为青年学者分享创新、链接资源、共做大事的平台,推动产出具有世界影响力的成果。此次香港青源会成立,既为全球 AI 青年学者搭建了交流合作平台,也将助力香港成为 AI 领域学术创新与产业转化枢纽,未来有望成为推动 AI 跨地域、跨学科协作的重要力量,为人类智能时代贡献青年智慧。当日下午,香港青源会接续开展了特别活动。

2025-09-09 12:01:08 451

转载 活动报名|无需任何标注数据,大模型也可自我提升,腾讯R-Zero,利用大模型自我奖励的强化学习训练来实现自我演进

在这一框架中,首先从一个基础 LLM 出发,初始化两个具有不同角色的独立模型:一个是挑战者 (Challenger),另一个是解答者 (Solver)。这两个模型分别独立优化,并通过交互共同进化:挑战者的奖励来自于提出接近解答者能力边界的任务,而解答者的奖励则来自于不断解决挑战者提出的更具挑战性的任务。然而,现有的自演进训练方法仍然严重依赖于大量人工整理的任务和标注 (human annotation),通常通过微调或强化学习来实现,这就成为推动 AI 系统超越人类智能能力的一大根本瓶颈。

2025-09-09 12:01:08 116

原创 从清华园到青海湖:系统研究「真爱」之路丨翟季冬专访

这需要它能感知底层芯片的特点,比如针对某一款特定的 AI 芯片,它有哪些硬件功能,编译器在转换代码时就需要有效利用这些硬件功能,才能充分发挥底层硬件的性能。清程极智目前提供的大模型端到端的训练和推理及配套的性能优化服务,已帮助数款大模型实现了在国产芯片上的快速预训练和高性能推理优化,全面降低了大模型的部署成本,极大提升了大模型的运行效率。智源专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。

2025-08-20 12:03:38 882

转载 GPT-5将上线,OpenAI 这份“作业”合格吗?| 青源Workshop第33期

据报道,此次升级打破传统单一模型格局,通过整合 o‑series(如 o3)推理模型和 GPT‑4o 的多模态能力,构建首个“全任务引擎”——用户无需在文本、代码、图像与工具调用间切换,即可实现对话、推理、执行的一站式体验。微软 Copilot 的智能模式已率先接入 GPT-5,可以根据任务复杂度动态切换“快速-深度”双思考模式。织「GPT-5 上线,OpenAI 交作业」线上 workshop ,邀请领域内多位专家与研究者,共同探讨 GPT-5 的无限可能。8月8日(本周五),下午3。

2025-08-07 14:31:18 134

转载 智源TALK | 连续思维链为何更强?Russell学生最新工作

我们证明,一个两层transformer可以通过 D 步连续 CoT 解决有向图可达性问题,其中 D 是图的直径,而目前已知的关于采用离散 CoT 的常数层 Transformer的最优结果则需消耗 O(n^2) 的步数(n 为顶点数量,且 D < n)。然而,尽管已有研究从理论上证明离散 CoT 技术能提升模型能力,针对连续思维链(continuous CoT)在一些复杂推理任务(如有向图可达性)上的优越性仍缺乏理论理解。他本科毕业于清华大学姚班。基于叠加态的推理:一个关于连续思维链的理论视角。

2025-07-31 12:01:27 83

转载 对话Meta杨凯峪:给 AI 打钢印的人丨独家专访

我通过和他联系,得到去密歇根大学实验室实习一个暑假的机会,主要研究计算机视觉,这也是他的研究方向。博士期间,我的研究方向也在不断调整,从最早的计算机视觉到后续工作,一路走来经历了不少变化,也收获了很多宝贵经验。即使彼此不在同一个团队,也不存在上下级关系,只要我们对同一个问题感兴趣,就能一起去做,然后把成果展示出来,也会得到认可。专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。本次专访为总第28期。

2025-07-22 12:02:44 154

原创 北大贺笛:研究是条河,我们需驭浪前行丨智源独家

智源专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。篇,但因为此前积累的阅读基础,再看新一年的论文时,很容易判断新论文的来源。我见过的发展最好的学生,都是那些能走在导师前面的;贺笛的研究经历充分证明:研究如奔涌不息的长河,唯有锁定真问题、躬身实践的人,才能在学术浪潮中勇立潮头。换句话说就是,你永远看的是当前的研究方向最重要的东西是什么,然后跟着最前面的那些水滴一起往前冲就可以了,我觉得是这个样子。

2025-07-14 12:01:32 431

转载 智源TALK丨Lumina 具身智能社区联合创始人分享,周四直播

因此我们提出了 RoboTwin 2.0,提供基于多模态大模型与仿真在环的自动化专家代码合成方案,开源了含 731 个,147 类带丰富标注物体的 RoboTwin 物体数据集(RoboTwin-OD),并基于两者构建了支持 5 款本体与 50 个任务的大规模域随机化仿真双臂操作数据合成器与评测基准集。双臂机器人在协同装配、工具使用和物体交接等复杂场景中具有重要作用,但要训练出通用的 VLA 等操作策略,现有数据收集和仿真管线面临多重瓶颈。另一方面,现有仿真缺乏针对新任务的高效、可扩展的专家数据生成方法;

2025-07-14 12:01:32 145

原创 斩获最佳论文后,他没有All In自动驾驶,而是All In了具身智能!| 专访 CVPR 最佳·李弘扬

在深入思考与调研后,我逐渐意识到,具身智能在其四大核心要素:算法、数据、硬件与应用场景的每一个层面都蕴藏着巨大的研究价值和应用潜力。这并非一次简单的“转型”,而是一场深思熟虑后的“升维”,是将一套业已成熟的“感知-决策-执行”闭环框架,向更通用、更复杂的物理世界进行的自然延展。虽然我个人确实减少了对许多媒体账号的关注,但来自朋友,尤其是投资圈朋友的信息分享,有时也难以避免。不过,从另一个角度看,这或许是件好事。如,只要模型更大、数据更多、计算更强,语言模型的表现就会越来越好,而且提升是稳定的、可预期的。

2025-07-07 12:30:24 1009

转载 智能体丨Sakana AI & 英属哥伦比亚大学,达尔文哥德尔机

然而,在复杂的现实世界应用中,由这些语言模型驱动的智能体系统往往表现不如普通领域专家。在本次报告中将介绍一个新兴研究方向智能体自动化设计 (Automated Design of Agentic Systems, ADAS),重点介绍首批描述该领域的工作之一ADAS(https://www.shengranhu.com/ADAS/),以及我们近期基于ADAS,探索通过修改自己代码、实现递归式自改进的达尔文哥德尔机(Darwin Gödel Machine, https://sakana.ai/dgm/)。

2025-07-07 12:30:24 170

原创 智源大会AI安全论坛:深挖风险红线,探讨应对措施

因为每个公司我们都讨论到,安全是非常重要的,但由于竞争问题,所有的公司可能在目前的安全问上没有做出足够的努力。我认为这将是未来的趋势,正如昨天说的 Yoshua Benjio也创建了自己的AI安全公司,在Real AI我们也在做类似的事情。在您最近的实验的AI控制报告中,您使用了被信任的GPT-3.5 来监控和不被信任的GPT-4来生成代码。段雅文:王希廷老师,您是大数据模型的神经科学领域的专家,您在最近的研究中安全概念上的启动因素揭露了通过可传输的提示和输入,对齐的模型甚至都可以被系统性地操纵。

2025-06-30 14:34:16 1276

原创 自主智能体——迈向通用智能的必由之路丨智能体论坛精华集锦

在长链路调优中,团队采用后向对齐的方式,将多智能体组成的链路视为齿轮系统,通过固定后面的系统,调优前面的系统,实现多轮优化,显著提升了系统性能。智能体的认知结构由一些不同的核心内在状态组成,这些内在状态包括世界模型等用于根据当前状态预测未来的技术模块、用来存取过往经验的记忆模块、驱动智能体的目标模块、表征即时状态的情绪模块、以及综合长短期目标和当前状况来给予反馈的奖励模块等。与传统在线教育相比,该平台利用大模型和多智能体技术,以更低的成本和更少的时间构建自适应课程,并为每个学习者提供智能体陪伴学习。

2025-06-26 12:02:41 926

原创 属于青年人的舞台丨18位青年,闪耀InnoVibe

为提升世界模型在通用决策场景中的适应性,他提出了AdaWorld模型。他的分享围绕三个主题展开:化学材料的实验方案规划、实验平台UniLabOS的标准化能力,以及实验助手机器人ChemBot的辅助执行潜力,探索如何更好地连接模型与实验,助力“会想的模型”成为“会做的科学家”。InnoVibe共创场为青年科学家打破传统学术交流的界限,打造一个自由开放、灵感奔涌的创新场域,让来自多元背景与前沿领域的青年英才在此激荡思想、碰撞火花,携手探索人工智能的无限可能,为 AI 领域的未来生长注入生生不息的动能。

2025-06-26 12:02:41 550

转载 2025北京智源大会“从AI for Science到AI for Industry”专题论坛成功召开

6月6日下午,2025北京智源大会“从AI for Science到AI for Industry”专题论坛于北京成功举办。论坛由北京智源人工智能研究院主办,中国互联网协会指导,中国互联网协会人工智能工作委员会、中国移动研究院共同承办。中国互联网协会副理事长兼常务副秘书长陈家春为论坛致辞。中国移动副总经理程建军,北京大学教授、北京智源人工智能研究院理事长、中国互联网协会人工智能工委会主任委员黄铁军,中国石油数智研究院院长杨文军,中国钢研人工智能首席科学家张云贵,北京大学研究员曾泽贤,国药数字科技(北京)有限

2025-06-19 13:41:33 253

原创 朱军、汪玉、俞士纶、吴郁杰、戴望州、贺笛、石佳欣等分享下一代AI路径探索|智源大会精彩回顾

传统图模型在欧式空间训练,泛化能力差,难以捕捉图的复杂结构。该方法无需标签数据即可进行对比学习,在节点分类、链接预测任务中表现优于欧式空间模型,泛化能力强,对训练和测试数据集敏感度低。算法实践中,采用强化学习加速机器人决策,开展无人机打排球实验,提出三阶段分层自博弈算法,机器人自主学会二传吊球等人类策略,目前真机已能直上直下颠球。最后,教授总结,黎曼几何为图模型带来全新思路,在无外部标签情况下可处理分类、预测及动态网络,相比欧式空间显著提升泛化性与深度,为图基础模型发展提供了新方向。

2025-06-19 13:41:33 667

原创 AI在如何重塑科研范式?智源大会「AI与科学的共生未来」论坛精彩回顾

和大家一起回顾了AI for Science发展的整体历程,从基础理论的突破性进展到产业应用的落地探索,从跨领域协同创新到技术边界研讨,引出聚焦“AI与科学共生”内核,探索AI与科学如何相互催化、协同进化,共绘科学智能时代的蓝图。人工智能将为分子科学研究带来更深远的影响,助力科研人员攻克更多难题,推动科学发现的加速发展,为人类健康和材料科学等领域带来实质性的突破与创新。他指出人工智能技术,尤其是深度学习,正全方位重塑分子科学研究范式,为药物发现、材料设计等关键领域带来前所未有的发展契机。

2025-06-18 12:05:00 1129

原创 清华助理教授Alex Lamb专访:告别微软,我为什么坚定选择了中国

我只在谷歌大脑实习过。这对我来说是一种全新的体验,让我看到了这种截然不同的研究方式,所以我很享受这种体验。因此,我认为中国的学术质量会越来越高,这是必然的。但我认为,做研究的另一种不错方式是,尝试提出新的问题,或尝试用不同的方式看待问题。生成模型已经让我们走得很远了,但我认为,如果我们能发现一种对空间的智能抽象,我们就能在那里学习模型,模型性能就会大幅提升。对我来说,最重要的节点之一就是在亚马逊获得研究员职位,尽管那属于我职业生涯的早期,但这个环境让我能够做很多研究,并与当时一些经验丰富的优秀人才共事。

2025-06-17 11:26:44 816

原创 Make RL Great Again:大语言模型时代的强化学习推理丨记深度推理模型论坛

针对 Batch 中输出长度各异的情况,吴翼老师团队提出了“动态 Batching”技术,通过贪心的方法将不同的输出“打包”,提升 GPU 的使用效率,减少了 Microbatch 的数量。使用同一个模型初始化一个策略模型和一个免费的过程奖励模型(Implicit PRM),采样数据的输入和输出,对数据难度进行过滤从而保证有意义的更新,通过结果奖励在线更新 PRM,获得免费的过程奖励。尽管 NSA 是一个稀疏模型,它却能更好的拟合训练数据,达到了更低的损失,有力地证明了原生可训练设计的有效性。

2025-06-16 12:16:34 1067

原创 AI创业CEO们的真实战场,如何跑通最后一公里丨智源大会精彩回顾

特别是V3版本的推出,将创作门槛降低到普通用户也能轻松使用的水平,例如不再需要复杂的指令,只需上传一张照片即可生成高质量的视频。这一突破引爆了全球社交媒体,包括广受欢迎的“超级变身”、“神明拥抱”等视频模板,推动PixVerse(拍我AI)迅速成为全球最受欢迎的视频生成产品之一,2025年4月月活用户超过1600万,全球累计用户超过6000万。杯子倒了,是预判“水会洒湿地面”。一是大模型的深度推理能力有了突破,开始具备类似“系统2”的逻辑推理能力,不再只是直觉式的“系统1”,这对AI来说是划时代的进步;

2025-06-11 18:11:49 1236

转载 2045年具身智能有望全面超越人类,代表人类走向星际丨具身智能与人形机器人论坛精彩回顾

今年的智源大会具身智能与人形机器人分论坛邀请到了来自清华大学、北京大学、北京邮电大学、上海人工智能实验室知名高校和研究机构的学者专家以及众擎机器人、千寻智能、北京人形机器人创新中心等具身公司的创始人与CTO分享前沿研究与产业实践。清华大学交叉信息研究院助理教授、千寻智能联合创始人高阳指出,机器人数据采集成本高(需遥操作 + 物理交互),且难以用语言描述(如游泳),形成“无智能-少机器人-少数据”的恶性循环,可利用。,具身智能有望代替人类从事不愿干、危险的劳动,但这并非具身智能的终极目标。

2025-06-10 17:32:27 264

原创 Meta、MIT、人大、腾讯、字节、Luma AI、Sand.ai:他们正重新定义多模态 | 智源大会·多模态论坛精彩回顾

大量实验表明,LLaDA 具有良好的可扩展性,在指令追随任务中,LLaDA 8B 的表现与 LLaMA 3 8B 相当,且相比自回归模型,LLaDA 的训练过程更为一般化,无需微调,支持多种采样方式。总体来说,上半场是追平人类的能力,下半场是要超越人类。但是这些新能力往往很难用传统的评估方法的衡量,这也促使我们重新思考应该怎么评估生成和理解相互促进这个问题的,传统的评估方式可能是不足的。在单一模态中,自回归的语义层级是一致的,比如预测下一个像素、patch、帧等,它们在模型中的“理解距离”是统一的。

2025-06-09 18:05:12 1093

原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。

2025-06-07 18:17:19 975

原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。

2025-06-07 18:17:19 736

原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。

2025-06-07 18:17:19 493

原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。

2025-06-07 18:17:19 1202

原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。

2025-06-07 18:17:19 307

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除