《城轨大模型平台：城轨行业视觉与语言多模态融合的关键技术、智能体应用与落地成效》

原创

于 2025-10-01 10:50:33 发布 · 285 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#大数据 #人工智能

摘要
大模型平台是国内首个面向城轨全业务链条的行业级多模态大模型体系，以“视觉大模型+语言大模型+多模态数据底座”为核心，构建“业务中枢-智能体中心-意图管理”三层架构，实现安全、运行、服务、管理四大价值域的AI原生赋能。本文系统阐述平台技术路线、关键智能体、端边云协同机制及量化成效；给出安全值守、车辆调度、客流组织、智能维修等六大典型智能体的算法原理与代码原型；提出“行业案例→标准规范→意图管理→数字员工”的可持续运营范式。实测表明，平台使故障发现时间缩短60%，车辆调度效率提升28%，乘客投诉率下降18%，为“交通强国”提供了可复制的城轨AI样板。

关键词
城轨千帆；视觉大模型；语言大模型；多模态；智能体；端边云协同

1 引言
2025年2月，交通运输部《城轨智能化发展行动计划》首次提出“构建城轨行业大模型”。

城轨大模型平台以视觉、语言、多模态大模型为技术底座，覆盖供电、车辆、信号、票务、乘客服务等20+专业系统，形成“设备-数据-模型-智能体”一体化解决方案，填补了国内城轨行业级大模型的空白。

2 平台总体架构
图1 城轨大模型平台架构
① 感知层：PSCADA、BAS、ATS、CCTV、PIS、AFC等20+专业系统
② 数据层：多模态数据清洗、智能标注、数据增强、数据预测
③ 模型层：城轨视觉大模型、城轨语言大模型、城轨多模态大模型
④ 智能体层：安全值守、车辆调度、客流组织、智能维修、施工管理、乘客服务
⑤ 应用层：领导驾驶舱、数字员工、大模型API、意图管理

3 关键技术
3.1 城轨视觉大模型（Vision-Centric Multimodal）

架构：SwinV2-G + 点云Transformer，统一视觉Token
功能：设备缺陷检测、抛洒物识别、客流密度估计
成效：缺陷漏检率<0.3%，抛洒物准确率97%

3.2 城轨语言大模型（Language-Centric Multimodal

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

交通上的硅基思维 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。