数据分析全流程案例
案例分析:城市电动汽车充电桩部署推荐
数据分析流程如下
问题定义
提出工业问题,将宽泛问题转化为可量化的问题。
- 在城市哪些地点应该部署充电桩?
- 该部署多少数量的充电桩?
- 应该部署普通还是快速充电桩?
数据获取
寻找多个数据源,以防单个数据源失效,并且需要确认数据源的真实性。
- https://www.evchargeonline.com/上海市冲换电设施公共数据采集与监测平台
- https://www.teld.cn/青岛特来电新能源有限公司
- http://www.datashanghai.gov.cn/上海市政府数据服务网
清理和存储
首先要对数据进行分析,再决定数据的使用方法
- 充电站分为专用和公用,保留公用
- 有些充电站的实时使用状况更新频率极低,去除
- 将充电站和停车场通过名称和地址关联
- 从电动汽车轨迹抽取停车事件
分析与建模
选择充电站部署区域
新充电桩需求:停车事件数目-充电桩数目
需要部署多少、何种类型充电桩
X:停车场规模,不同时间停车数量,区域类型,预计部署充电桩数量、类型等
Y:充电桩使用率
系统展示
- 新充电桩区域热点界面
- 预测新部署充电桩后使用频率
撰写报告
报告的主要组成部分:
- 问题引入
- 数据介绍(数据量,属性类型,基本统计量等)
- 分析流程(整体框架优先,善用示例)
- 讨论与总结(回到问题,给出解答)