大模型如何从数字世界走向物理世界?蘑菇车联MogoMind在WAIC 2025打了个样儿

近年来,大模型技术发展可谓日新月异。最初,大模型主要聚焦于数字世界,以语言模型为代表,在文本生成、知识问答、语言翻译等领域表现不俗。随着技术迭代,多模态数字世界大模型兴起,融合文本、图像、音频等多种信息。比如,一些模型可根据文字描述生成对应的逼真图像,或对视频内容进行精准语义理解与分析,广泛应用于广告设计、影视制作、智能安防等行业,极大提升各领域智能化水平与工作效率。

与此同时,大模型发展正朝着物理世界演进,千行万业迎来新的机会。在7月26-29日举行的2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,我们注意到,深耕交通领域多年的蘑菇车联(MOGOX)围绕AI大模型在交通领域的应用,展示了首个物理世界认知模型MogoMind、智能体与物理世界实时交互的AI网络等多项核心技术产品,为我们诠释了AI与物理世界深度融合的未来图景。

据蘑菇车联副总裁王凯介绍,相比数字世界中的大模型,MogoMind可以视为物理世界的实时搜索引擎,是理解现实世界的钥匙,通往现实世界的超级入口。通过接入物理世界实时动态数据,MogoMind形成全局感知、深度认知和实时推理决策能力,能够从数据中抽取意义、从经验中学习规则、在场景中灵活决策,为AI网络基础设施建设、实现实时数字孪生效果和路侧数据上车应用提供关键支撑,成为城市和交通高效运行的“AI数字基座”。

首个物理世界认知模型何以蘑菇车联

首个物理世界认知模型由蘑菇车联提出,在王凯看来,是水到渠成、顺势而为的必然。

技术方面,创立于2017年的蘑菇车联,目前已形成了AI网络基础设施与自动驾驶全栈研发能力,专注于构建智能体与物理世界实时交互的AI网络,并首创将物理世界实时数据纳入训练,突破传统模型依赖互联网静态数据的局限,形成“感知-认知-决策-反馈”闭环。经过在车路云一体化、自动驾驶等领域的技术积累,蘑菇车联已具备提供AI网络基础设施和自动驾驶全栈技术解决方案的能力,包含从AI大模型(MogoMind)、路侧基础设施(AI数字道路基站)到车端智能系统(L4级自动驾驶车辆)的全链条技术研发和交通场景应用落地。

市场方面,智能交通发展面临数据割裂、生态分散和成本失衡等痛点,亟需从技术创新到落地应用的全链条破局。特别是在数据方面,交通体系沉淀着大量的尚未被开发的“沉睡数据”,需要将这些数据的价值挖掘出来,转化为可以为交管部门、车企、用户利用的数据资产。与此同时,蘑菇车联通过在北京、上海、桐乡等十余个城市落地AI网络项目,积累了海量且多类型的交通数据,并构建起动态实时环境数据库。为此,蘑菇车联以MogoMind为核心,用数据串联起AI网络与自动驾驶两大业务,为各方进行数据赋能,构建起完整的“智能交通+智能出行”解决方案,顺应了行业从“单点智能”迈向“全局智能”的发展趋势。

当然,王凯也坦言,MogoMind的研发看似自然,实则也是一场场技术攻坚战打出来的,其中的难点包括如何高效处理和融合海量多源异构的交通数据、如何在复杂交通场景中实现准确、实时的认知与决策,以及如何平衡模型规模、算力需求和计算效率,以实现模型的规模化落地应用。

提升大模型泛应用能力,MogoMind掌握核心科技

大模型如何突破单一领域或场景限制,在跨行业、多场景、多模态任务中实现高效适配、灵活落地并解决实际问题,也就是通常所说的大模型的泛应用能力,已日益成为大模型下一步的核心话题。而在物理世界中,对大模型泛应用能力的要求更高、场景更复杂、技术难度更大。

“MogoMind的感知精度和认知准确度超过90%,多模态推理准确率超过88%,采用多模态大模型与感知端到端模型的混合架构,结合端到端预测与规则约束,在高速变道、避障、城市路口通行等关键决策点,AI可以自主学习驾驶策略,同时结合专家规则进行约束,确保行为安全且符合法规要求。”王凯在与交流中表示。

具体说来,MogoMind在数据层、模型层、应用层进行了多项技术创新。

数据层MogoMind一方面实现了多源数据交叉验证,通过融合路侧激光雷达、车载摄像头、交管系统等多源数据,对同一目标(如车辆位置)进行冗余校验,消除单一传感器误差;另一方面支持实时动态训练,将真实交通事件(如事故)实时注入训练流程,通过强化学习(RLHF)纠正模型的错误预判。

模型层MogoMind嵌入先验知识,在模型中硬编码交通规则(如红灯停、行人优先),约束生成结果的合理性。此外,通过神经网络估计预测置信度,对低置信度结果(如极端天气下的目标识别)触发人工介入或多模型投票,实现对不确定性的量化。

应用层安全冗余设计也必不可少。比如在自动驾驶场景中,MogoMind输出的决策需同时通过车端算法(如紧急制动系统)和云端二次校验,确保双重保险。

六大关键能力,筑基城市交通三大角色

MogoMind依托交通数据流实时全局感知、物理信息实时认知理解、通行能力实时推理计算、最优路径实时自主规划、交通环境实时数字孪生、道路风险实时预警提醒六大关键能力,解决了当前AI缺乏物理世界实时感知能力和全局认知系统两大核心问题。

  1. 通过全域覆盖的通感算一体化设备,MogoMind能够全天候、不间断捕捉车辆行驶轨迹、速度变化、交通流量、行人动态等海量异构数据,并经过数据融合算法快速整合处理,为智能分析和精准决策提供数据基础。
  2. 借助物理信息实时认知理解能力,MogoMind不仅能够识别路面状况、交通标识、障碍物的物理状态,还能将复杂的交通环境信息转化为可理解、可执行的智能决策建议,为交通管理部门和出行者提供应对方案。
  3. 交通流预测方面,MogoMind通过交通流预测模型和通行能力评估算法,对道路通行能力进行实时动态计算,其综合考量交通流量、车辆类型、道路几何特征、信号灯配时等多种因素,利用强化学习技术,挖掘交通数据背后的规律和趋势,预测未来时段的交通流量变化趋势。
  4. MogoMind还提供实时路径规划、数字孪生、预警提醒等多种服务,能够无缝接入来自不同厂商、不同类型的交通设备与系统,包括道路传感器、车载终端、交通管理系统等,实现多源数据的统一管理和协同处理。对于车企,MogoMind提供多种接入方案,方便车企接入平台数据进行功能适配与应用开发。政府部门、交管部门、车企都能在MogoMind找到适合自身需求的应用场景,实现资源共享与优势互补,推动AI与交通生态的融合发展。

基于这六大关键能力,MogoMind已担当起城市交通“决策中枢”、车辆行驶“全能助手”、自动驾驶“隐形基座”三大角色。

  1. 交通管理领域,MogoMind让交通管理者轻松掌握整个城市交通系统的运行全貌,无论是宏观层面的交通流量调控、微观层面的单个路口优化,还是道路突发事件应急处理,都能基于实时动态数据的融合分析做出科学决策,实现城市交通管理的整体协同优化。
  2. 出行领域,MogoMind提供物理世界实时信息的深度理解与规划决策服务,超视距路况提醒、最优路线动态规划、盲区风险实时感知等能力全面守护驾驶安全,提升出行效率。
  3. 自动驾驶领域,MogoMind通过多源数据融合和长尾场景持续学习,反哺自动驾驶模型训练,进一步提升自动驾驶技术安全性与可靠性。

从技术、行业发展的趋势来看,未来的人工智能必然要融入现实生活,重塑物理世界的格局。正如黄仁勋所说,AI的下一代浪潮是物理AI。以蘑菇车联为代表的深耕行业领域的领导者,注定也是推动物理AI发展的先行者甚至主力军,让我们一起期待万物智能物理世界的到来。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值