UrbanEV:首个大规模电动汽车充电行为开源数据集与预测工具包发布
项目背景与意义
随着全球电动汽车(EV)保有量的快速增长,城市充电基础设施的规划与管理面临着前所未有的挑战。准确预测充电需求对于电网负荷平衡、充电站优化布局以及用户服务体验提升都具有重要意义。然而,现有研究往往受限于数据获取难度,缺乏具有足够时空粒度的真实充电行为数据集。
UrbanEV项目由中山大学智能系统实验室主导,联合香港理工大学等机构共同开发,旨在填补这一空白。该项目首次公开了中国深圳地区的大规模电动汽车充电行为数据集,并配套发布了完整的预测模型工具包,为交通电气化、智慧城市和能源管理领域的研究提供了宝贵资源。
数据集核心特点
数据规模与覆盖范围
UrbanEV数据集采集自2022年9月至2023年2月期间深圳市的公共充电设施,具有以下显著特点:
-
空间覆盖全面:原始数据包含1,682个公共充电站,24,798个充电桩,覆盖331个交通分区。经过清洗后的基准数据集包含1,362个充电站和17,532个充电桩,对应275个交通分区。
-
时间分辨率精细:原始数据以5分钟为最小时间单元记录充电状态,同时提供聚合后的1小时分辨率数据,满足不同研究需求。
-
多维特征丰富:数据集不仅包含基础的充电量信息,还整合了丰富的时空特征,如地理位置、时间戳、天气条件等上下文信息。
数据质量与处理
研究团队对原始数据进行了严格的质量控制:
- 异常值检测与处理:采用统计方法和领域知识识别并修正异常充电记录
- 缺失值填补:结合时空相关性进行合理插补
- 数据标准化:统一不同来源的数据格式和单位
- 隐私保护:对敏感信息进行匿名化处理
清洗后的数据集更适合机器学习模型训练,同时保留了原始数据的统计特性。
技术工具包组成
UrbanEV项目不仅提供数据,还开源了完整的预测模型实现,包括:
传统时间序列模型
- 自回归(AR)模型
- 差分整合移动平均自回归(ARIMA)模型
基础机器学习模型
- 全连接神经网络(FCNN)
- 长短期记忆网络(LSTM)
图神经网络模型
- 图卷积网络(GCN)
- 时空图卷积网络(ASTGCN)
前沿Transformer架构
- 多种基于注意力机制的时空预测变体
工具包采用模块化设计,支持快速模型比较和扩展。所有代码都经过优化,可在普通计算设备上高效运行。
应用场景与价值
UrbanEV数据集和工具包在多个领域具有广泛应用前景:
-
城市充电设施规划:帮助相关机构科学评估充电需求分布,优化基础设施投资
-
电网负荷管理:支持电力公司预测充电高峰,制定合理的电价策略和调度方案
-
用户行为研究:揭示电动汽车用户的充电习惯和偏好,为服务创新提供依据
-
算法基准测试:为时空预测领域的研究者提供标准化的评估平台
学术贡献与影响
UrbanEV项目已经产生了多项高水平研究成果,相关论文发表在IEEE智能交通系统汇刊、Sustainable Cities and Society等权威期刊。这些工作探索了物理信息神经网络、自然语言处理辅助预测等创新方法,推动了充电行为预测领域的技术进步。
项目团队特别注重开源精神,采用CC0 1.0通用许可,最大限度降低使用门槛。数据集和代码的完整文档、示例和教程都随发布包提供,方便研究者快速上手。
未来发展方向
UrbanEV项目将持续更新和维护,计划中的改进包括:
- 扩展数据覆盖时间和空间范围
- 增加更多上下文特征(如节假日、特殊事件)
- 开发更高效的在线学习算法
- 构建交互式可视化分析平台
UrbanEV的发布标志着电动汽车充电行为研究进入了一个新阶段,为智慧城市和可持续交通发展提供了重要技术支撑。研究团队欢迎各界人士参与项目共建,共同推动交通电气化技术的进步。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



