这里具身智能我打算通过三篇文章来介绍具身智能的相关内容,分别是具身智能的研究与发展前景相关,然后是关于仿真环境搭建相关的内容,分为isaac sim和gazebo两个大的种类。这里我们来看具身智能的研究与发展.
首先是一些重要的时间,从春晚舞台上整齐划一跳舞的人形机器人,到北京机器人半马的活力奔跑,再到杭州机甲格斗赛的热血对抗,具身智能正以极具冲击力的方式闯入大众视野,成为社会热议焦点。

但是在这么火热的技术背后,仍然存在着很多的问题,包括但不限于硬件层面,软件维度和社会伦理层面。
目录

具身智能的发展背景
自 1956 年 AI 概念诞生以来,智能的发展主要由符号主义与连接主义主导,两种范式从不同的侧面模拟人类的大脑,在以互联网信息处理为代表的领域取得了极大的成功。
随着深度学习的发展,基于网络数据训练的大模型似乎正在触及AI认知的边界,Scaling Law下的预训练大模型性能似乎快要达到极限,参数量和数据量的扩充已经难以给模型带来质的突破。
AI想要进一步发展,必须与物理世界建立更加紧密的联系,具身智能将是AI向AGI进步的关键途径
从历史的角度来看,工业机器人的硬件设备不断发展,从自动化设备到移动机器人,从协作机器人到人形机器人,每一步都代表着技术的进步和创新。
技术的每一次进步都会带来机器人应用场景的突破,且一般会在精准、重复的工业场景作业流程中率先得到应用。当下,已经进入了AI大模型与机器人在底层技术创新和应用融合的交叉时代。
如何提升智能机器人在开放场景的可用性,是具身智能正在解决的问题

具身智能:两条发展线的汇聚点,“AI的下一个浪潮是物理AI”
人工智能和机器人技术的发展并非孤立进行,而是相互促进、共同演进的。人工智能为机器人赋予了“大脑”,使其具备感知、思考和决策能力;而机器人则为人工智能提供了“身体”,使其能够与真实世界进行交互,获取经验和知识。
具身智能的兴起是人工智能和机器人技术各自发展到一定阶段的必然结果,是两者深度融合的体现。
人工智能的持续进步需要与物理世界的交互,而机器人的未来发展也离不开更高级别的智能化

具身智能的发展主要来自于两个领域的交叉融合,一方面机器人的通用智能需要借助人工智能,另一方面人工智能走向物理世界 需要一个身体,同时涉及到包括机械工程自动化、嵌入系统控制优化、认知科学、神经科学等多个学科的融合。
这也导致了当前对具身智能这一概念的界定,不同专家的说法略有差异,一类观点强调具身交互对智能的影响。另一类观点关注具身交互对解决实际问题的作用。

智能不仅体现在处理信息和解决问题的能力上,还体现在对其周围环境的感知、理解和操作能力上
具身智能的发展现状

各国均将以人形机器人为代表的具身智能上升到国家战略,通过跟进完善制度建设、提供资金补贴等方式推动技术发展。
国内相关政策主要围绕加快具身智能机器人重点场景应用、加强行业标准规范建设、设立专项财政与基金支持、加速人才引进与技术培育等方面,通过政策推动,在短期实现核心零部件的技术突破,在长期建设丰富产业应用和生态。

全球工业机器人整体仍然保持增长态势,其中中国工业机器人安装量一枝独秀,2023年安装量高达27.6万台,占全球安装总量的51%。与此同时,来自国产品牌的工业机器人供应商也得到了快速发展,本土供应商已经近乎占领一半的国内市场。

随着人工智能算法的发展,尤其是多模态大模型技术的突破性进展,显著加速了机器人产业的发展,提升机器人的智能水平,使得机器人能够自主进行判断和识别,执行复杂的多阶段语义推理任务。不仅提高了机器人的泛化能力,也快速推动了人形机器人通往量产的进程。
根据Gartner技术成熟度曲线,当前的具身智能仍处于技术萌芽期,虽然受大模型技术的推动成为科技产业的热点,但是初创公司技术和商业化路径还没有找到有效方案,在成本、技术等层面仍然需要攻坚克难。


从“大脑-小脑-肢体”的架构来看,分层模型通过不同层次模型协作,利用底层硬件层和中间响应快的小模型弥补上层大语言模型的不足,推动机器人在实际场景的应用,并越来越多地采用基于学习的控制方法。
VLA等端到端模型能够直接实现从人类指令到机械臂执行,即输入图像及文本指令,输出夹爪末端动作。

数据规模、模型泛化性、响应速率等问题是当前端到端具身大模型需要逐步攻克的弊端,需要在数据采集和模型训练上寻求新的突破方法。
根据智元机器人定义的路线图,当前具身智能大脑已经具备认知、推理、规划的能力,且而小脑层面机器人技能任务的训练也是通过深度学习以驱动的。随着场景、数据的增多,多个特定小模型会逐渐泛化为通用操作大模型,并最终实现与上层模型的融合。

应用场景与代表厂商

自动驾驶是具身智能的一个重要场景,都具备“感知-决策-规划-控制”的算法架构,具身智能和自动驾驶在技术实现路径上是一脉相承的,且算法与零部件可实现高度复用,这是Tesla给业界带来的启示。
汽车行业从主机厂到供应商,从投资人到创业者,都在从自动驾驶转向追求更多场景的具身智能:主机厂或自研或投资具身智能公司,而人形机器人企业也在寻求机器人“进场打工”的机会。

源于不同技术背景的科技企业聚焦具身智能,其技术基因、产品形态、性能表现及应用场景的差异性正在帮助它们融入工业、服务、特种应用等各类型应用场景。

具身智能的物理载体形态呈现多样性,根据其移动特性或方式,可以分为固定底座机器人、轮式(履带式)机器人、足式机器人、仿生机器人等,其中近期火爆的人形机器人属双足人形。

当前,英伟达已经从多个方面部署具身智能,包括计算平台的升级、多模态大模型的研发、软件开发工具包的发布和对外具身智能机器人公司的投资,正在形成一个完整的具身智能底层技术生态体系,专注于提供基础设施、算力支持和工具框架。

特斯拉通过自身的品牌影响力与对“低成本量产”的目标,成功地自研了电动汽车的核心零部件并极好地控制了成本,而这些电动汽车的核心零部件也可以大量地复用在人形机器人之上,例如视觉传感器、关节、电机、电池、热管理系统等。

发展挑战与技术趋势

机器人的智能化水平仍受到现有方法与能力的制约,其感知能力、执行能力、学习能力、自适应能力、硬件性能、验证方法等受限于技术水平与产业链现状,虽然展现出了潜力,但距离实际落地应用仍有较远的距离。

当前的具身智能是通过深度学习技术(模仿学习、强化学习等)从大量数据中学习并实现的,巨量的、优质的、多样的数据,是具身智能机器人能够实现各种各样自主操作的基础。
数据采集方式呈现多元化,人工示教(遥操、动捕)、机器人自主探索、仿真合成数据等方式各有优劣,为具身智能训练数据集添砖加瓦。

结论

具身智能将进一步加深对智能本质的深刻理解。通过感知、决策、 行动、反馈的循环,具身智能可以实现持续地智能进化。
一是数据驱动下的"感知—决策—行动—反馈"闭环,具身智能需要具备跨模态(如视觉、听觉、触觉)感知和认知能力,以能够更好地理解复杂场景,并在其中做出更加精确和灵活的响应,获得更全面和深入的环境理解。
二是形态涌现,将通过强化学习、进化算法等技术,实现具身智能形态和行为的自适应和优化,提升自主决策能力和行为执行的精确性。
三是多体协同,如何构建多个智能体之间的协作框架,实现集体优化是多体协同关注的重点。

参考信息来源:
1.中国信息通信研究院和北京人形机器人创新中心有限公司——具身智能发展报告
2.北京科技大学教授 林倞——具身智能:迈向人机物高效融合与协作
3.中观村智友——具身智能科技前沿热点
具身智能研究与发展&spm=1001.2101.3001.5002&articleId=148983768&d=1&t=3&u=bc948e1c4b424921856127600f39492e)
1244

被折叠的 条评论
为什么被折叠?



