摘 要
大模型平台是国内首个面向城轨全业务链条的行业级多模态大模型体系,以“视觉大模型+语言大模型+多模态数据底座”为核心,构建“业务中枢-智能体中心-意图管理”三层架构,实现安全、运行、服务、管理四大价值域的AI原生赋能。本文系统阐述平台技术路线、关键智能体、端边云协同机制及量化成效;给出安全值守、车辆调度、客流组织、智能维修等六大典型智能体的算法原理与代码原型;提出“行业案例→标准规范→意图管理→数字员工”的可持续运营范式。实测表明,平台使故障发现时间缩短60%,车辆调度效率提升28%,乘客投诉率下降18%,为“交通强国”提供了可复制的城轨AI样板。
关键词
城轨千帆;视觉大模型;语言大模型;多模态;智能体;端边云协同
1 引言
2025年2月,交通运输部《城轨智能化发展行动计划》首次提出“构建城轨行业大模型”。
城轨大模型平台以视觉、语言、多模态大模型为技术底座,覆盖供电、车辆、信号、票务、乘客服务等20+专业系统,形成“设备-数据-模型-智能体”一体化解决方案,填补了国内城轨行业级大模型的空白。
2 平台总体架构
图1 城轨大模型平台架构
① 感知层:PSCADA、BAS、ATS、CCTV、PIS、AFC等20+专业系统
② 数据层:多模态数据清洗、智能标注、数据增强、数据预测
③ 模型层:城轨视觉大模型、城轨语言大模型、城轨多模态大模型
④ 智能体层:安全值守、车辆调度、客流组织、智能维修、施工管理、乘客服务
⑤ 应用层:领导驾驶舱、数字员工、大模型API、意图管理
3 关键技术
3.1 城轨视觉大模型(Vision-Centric Multimodal)
-
架构:SwinV2-G + 点云Transformer,统一视觉Token
-
功能:设备缺陷检测、抛洒物识别、客流密度估计
-
成效:缺陷漏检率<0.3%,抛洒物准确率97%
3.2 城轨语言大模型(Language-Centric Multimodal

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



