作者:种子张,疯聊AI全网账号主理人,人工智能行业从业者,布道师。
摘要
Abstract
一文了解具身智能的基本概念、发展历程、政策推动、技术体系、产业现状、应用场景、市场现状、创业机会、就业机会、未来趋势。
1.热点聚焦:具身智能的 2025 风暴
在 2025 年,具身智能领域迎来了爆发式的发展,从政策扶持到科技巨头的技术突破,再到社会应用的广泛实践,具身智能正以惊人的速度改变着我们的生活和未来发展格局。这一系列热点事件不仅标志着具身智能时代的加速到来,也为产业发展和社会变革注入了强大动力。
1.1 政策里程碑
2025 年,具身智能被首次写入政府工作报告,这一举措具有重大的战略意义,标志着具身智能正式被纳入国家未来产业的重点培育范畴。政府明确提出建立未来产业投入增长机制,加大对具身智能等前沿领域的支持力度,为产业发展提供了坚实的政策保障和资金支持。这不仅体现了国家对具身智能技术的高度重视,更向市场释放出强烈的信号,鼓励企业、科研机构等加大研发投入,推动技术创新与产业升级 。

随后,各地政府纷纷响应,出台了一系列具体的行动计划和扶持政策。深圳发布的《具身智能机器人行动计划 (2025—2027 年)》,目标宏伟,计划到 2027 年,关联产业规模达到 1000 亿元以上,新增 10 家估值超百亿企业。这一目标的设定,将有力地推动深圳在具身智能机器人领域的产业集聚和创新发展,吸引更多的人才、资金和技术资源汇聚。
北京的 "具身智能三年计划" 同样引人注目,旨在打造千亿集群,到 2027 年培育核心企业超 50 家,在科研教育、工业商业等领域落地百余项规模化应用,量产规模突破万台。同时,还将开放 300 万条数据集,为具身智能的研发提供丰富的数据支持,加速技术的迭代升级。这些政策的出台,为具身智能产业的发展营造了良好的政策环境,促进了产业生态的完善和发展。
1.2 科技巨头动态
科技巨头们在具身智能领域的布局和突破,成为推动行业发展的重要力量。2022年特斯拉发布的 Optimus 人形机器人项目一直备受全球关注,2025 年在量产进展方面取得了重大突破。特斯拉明确将 Optimus 年度生产目标提升至 5000 台,并计划 2026 年实现 5 万台产能。这一产能的提升,不仅展示了特斯拉在人形机器人制造领域的强大实力,也预示着人形机器人将逐步从实验室走向大规模商业化应用阶段。
为了实现这一目标,特斯拉在核心零部件技术上不断创新,如执行器集成化进程加速,震裕科技通过自主研发行星滚柱丝杠产品,结合电机铁芯技术优势,成功开发出线性执行器并启动送样测试;拓普集团和三花智控分别投入 50 亿元和 38 亿元建设生产基地,重点布局机器人电驱系统及机电执行器领域,推动高精度执行器的规模化生产。
在丝杠工艺上,恒立液压的滚珠丝杠产品已实现小批量供货,并完成线性驱动项目厂房建设;五洲新春通过与新剑传动合作,推动行星滚柱丝杠在新能源汽车和机器人领域的应用;震裕科技建成行星滚柱丝杆半自动产线,日产能提升至 50 套,并计划年内建设全自动产线。
在减速器与电机方面,特斯拉 Optimus Gen2 采用谐波减速器与行星减速器组合方案,推动国内厂商技术迭代,绿的谐波、双环传动等企业在谐波减速器领域持续优化产品精度和寿命;雷赛智能在东莞投资 5 亿元建设人形机器人核心零部件基地,专注于空心杯电机和伺服驱动技术的研发,其 DH 系列灵巧手解决方案即将在行业展会亮相 。
谷歌在具身智能领域也取得了重要突破,其 RT-2 端到端模型的出现,为具身智能的发展开辟了新的路径。RT-2 项目旨在训练一个能够从视觉输入直接学习到动作输出的机器人模型,作为一个基于 Transformer 的模型,它在互联网上的海量数据中对视觉 - 语言模型(VLM)进行预训练,然后在具体的机器人任务上进行微调,结合视觉和动作数据,形成了一个能够将图像直接转换为控制指令的视觉 - 语言 - 动作模型(VLA)。
2.概念篇:什么是具身智能?
前边有些内容可能有朋友没有看得太明白,现在开始,我们从概念开始理解,一层一层了解具身智能。那么,究竟什么是具身智能?它与传统 AI 又有何不同?其思想起源又可追溯到何处?接下来,让我们一同揭开具身智能的神秘面纱。
2.1 权威定义
中国信息通信研究院和北京人形机器人创新中心有限公司《具身智能发展报告(2024 年)》中指出:具身智能,依靠物理实体通过与环境交互来实现智能增长的智能系统。具身智能从字面可理解为"具身化的人工智能","具身"是前提,即具有身体且能通过交互、感知、行动等能力来执行任务, 具身本体的形态不必限制在外观上的"人形",同时身体的形态也不能作为判断是否属于"具身智能"的依据。根据使用用途和场景的不同,具身智能可以有多种形态,与具身相对的是离身。
例如,通用智能机器人,大型的工业设备加上 AI 系统,自动驾驶等多种具象化形态都属于具身智能。"智能"是核心,GPT-4o、Sora 等 AI 技术的最新进展,实现了对文本、视觉、语音等多模态信息的理解和转换。这一定义深刻地揭示了具身智能的核心内涵。简单来说,具身智能强调智能体不再仅仅是在虚拟世界中进行数据处理和运算,而是拥有了物理实体,能够像人类一样,通过自身的身体去感知周围的环境信息,然后基于这些感知到的信息进行分析、判断和决策,最后将决策转化为具体的行动,与环境产生实时互动。
例如,一个具备具身智能的机器人,它可以通过身上搭载的各种传感器,如视觉传感器、触觉传感器等,感知周围环境中的物体位置、形状、质地等信息 ;接着,根据这些感知信息,其内部的智能决策系统会迅速分析,判断应该采取何种行动,是抓取某个物体、避开障碍物还是完成其他任务;最后,机器人通过自身的机械结构和驱动系统,执行相应的动作,实现与环境的交互。这种感知 - 决策 - 行动闭环的实现,使得具身智能体能够在真实的物理世界中自主地完成各种复杂任务,展现出高度的智能和适应性。当然我们收集了业界专业人士对具身智能的理解:
美国计算机协会期刊:具身智能将人工智能融入机器人等物理实体,使其具备感知、学习和与环境动态交互的能力。
卡内基梅隆大学R EAL(Robotics, Embodied Al,and Leaning)实验室官网:具身智能是机器学习、计算机视觉、机器人学习和语言技术的集成,最终形成人工智能的"具身化":能够感知、行动和协作的机器人。
英伟达CEO黄仁勋:人工智能的下一个浪潮将是具身智能,即能理解、推理、并与物理世界互动的智能系统。
斯坦福大学教授李飞飞:具身智能是一种可以执行导航、操作和命令执行等任务的机器人, 机器人可以是任何在空间中移动的实体智能机器,如自动驾驶汽车、吸尘器,或是工厂里的机械臂等。
图灵奖得主,中国科学院院士姚期智:通用人工智能(AGI) 的未来发展需要具备具身实体,与真实物理世界交互以完成各种任务。
总体看下来上边的表述都差不多,要同时需要具备"本体+环境+智能"三要素。
2.2 核心突破传统 AI
具身智能与传统 AI(离身智能)相比,存在着本质的区别,实现了对传统 AI 的重大突破。传统 AI,以ChatGPT 为典型代表,主要是数据驱动的。它基于大量的文本数据进行训练,通过对这些数据的学习和分析,来理解语言的含义和模式,从而生成相应的回答或完成特定的语言任务 。然而,它的运行局限于虚拟的数字世界,缺乏与现实物理世界的直接交互能力。
例如,ChatGPT 虽然能够对各种问题进行准确的回答,无论是历史文化、科学技术还是日常生活问题,它都能凭借其强大的语言理解和生成能力给出详细的解释,但它无法真正触摸、感受和操作现实世界中的物体,不能在真实的环境中执行具体的物理动作。
而具身智能则是身体交互驱动的,以机械臂抓取任务为例,一个具有具身智能的机械臂,它不仅仅依赖于预先设定的程序和指令来执行抓取动作。它能够通过自身搭载的传感器,实时感知目标物体的位置、姿态以及周围环境的变化,如是否存在障碍物等。然后,根据这些实时感知到的信息,机械臂内部的智能系统会动态地调整抓取策略,包括调整机械臂的运动轨迹、抓取的力度和角度等,以确保能够准确、稳定地抓取目标物体。这种在物理世界中与环境实时交互并根据交互结果做出动态决策和行动的能力,是传统 AI 所不具备的。
此外,传统 AI 擅长在虚拟世界中进行推理和计算,对于抽象的逻辑问题和语言任务能够处理得相当出色。但面对复杂多变的物理世界,如不同的地形、物体的物理特性差异等,它往往显得力不从心,缺乏适应能力。具身智能体则不同,它们通过与物理世界的直接交互,不断积累经验和知识,能够快速适应各种复杂的物理环境和任务需求,展现出更强的灵活性和适应性。
2.3 思想起源
具身智能的思想起源可以追溯到上世纪中叶,其发展历程充满了探索与突破。1950 年,计算机科学之父艾伦・麦席森・图灵在《计算机器与智能》中提出了一个具有深远意义的哲学命题:"机器能否思考?"

这一命题犹如一颗思想的种子,预示了智能体通过物理交互实现认知的可能性,为具身智能的发展埋下了伏笔。在当时,受限于技术条件,低精度传感器、有限的计算能力以及欠缺的算法理论,使得这一构想难以取得实质性的突破,但它激发了科学家们对于机

最低0.47元/天 解锁文章
4051

被折叠的 条评论
为什么被折叠?



