摘要
通过对公交系统已有数据按照数据仓库相应业务主题划分,建立面向不同业务需要的多维分析模型(OLAP),通过OLAP分析模型的数据结果,辅助公交管理人员决策,进而通过对公交资源的合理调配,已达到提高公交业务系统的可靠性、运行效率、服务质量、减少公众出行时间、等待时间、降低运行和维护成本,提高驾驶员和乘客的安全性,使公共交通资源分配更加合理,资源利用率更高。
车载终端是车辆运行数据的主要来源,车载终端通过GPS设备周期性的传送车辆运行数据到调度指挥中心,车载终端数据包括车辆经纬度、时间、速度,站点、上客人数、下课人数等,通过对车载机数据的建模分析,可以对公交智能调度提供有效支撑。
- 公交系统数据仓库的建立
对“海量”数据最有效的分析处理方法就是建立数据仓库,数据仓库(datawarehouse)是一个面向主题的(subjectoriented)、集成的(integrate)、相对稳定的(nonvolatile)、反映历史变化(timevariant)的数据集合,用于辅助管理决策。
数据仓库结构主要星型和雪花型两种,本文采用业界通用的星型结构结构图如下:
图1-1数据仓库星型结构
公交系统数据仓库业务域主要包括:运营企业组织、运营人员、运营车辆、运营线路、运营站点、运营场站、机务维修保养、自助收银等。
建立公交系统数据仓库首要任务是对业务主题域进行划分,针对公交业务情况划分主题域:运营资源、运营线路、机务维修保养、运营收入。如图1-2.
图1-2数据仓库主题域
数据仓库主题域确定之后,通过Power Designer建模工具创建数据仓库物理模型,使用Oracle数据库做数据存储服务,数据仓库二维表格定义规范,DW_开头代表数据仓库事实表用于存储分析的维度与指标,DIM_开头代表维度表,事实表与维度表关联组成OLAP模型,如图1-3,其中浅黄色代表维度表,淡蓝色代表事实表。
图1-3多维模型
- 数据分析
多维分析对数据指标从多种维度观察,从中发现指标的变化规律,多维分析对数据立方(Cube)的操作包括:钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)等。
-
- 趟次时间分析
主场(副场)发车后,到达副场(主场)的运行时间,时间会依据早晚高峰及平峰不同时间段的路况,运行时间也会不同,通过数据分析。
图:2-1
-
- 站间时间分析
各线路车辆运行趟次最大站间时长分析,统计站间时长去除路况拥堵情况,影响站间运行时长的可能是客流量,若路况正常的情况,站间时间增大可能站点客流增加。
图:2-2
-
- 车辆间隔距离分析
通过车载机(GPS)设备上传的车辆经纬度数据,结合GIS地图应用实时展现离场发出车辆在线路上的间隔距离,距离加大等待时间增大,乘客体验越差,这里没有采用车辆发车间隔时间,是因为发车时间间隔固定,运行途中的各种路况导致车辆在途中并非是发车间隔时间,而通过线路上实时的车辆间隔更能直观的体现车辆是否有积压情况,随时通过车载机与当班驾驶员沟通情况,适时加以调度调整。
- 总结
通过公交系统数据仓库的数据建模分析,使公交运营管理更智能,资源利用率最大化,缩短乘客出行时间,降低运营成本,提高公交企业的服务水平与管理水平,公交系统数据仓库对公交运营管理有着重要的价值。