数据处理、分析与可视化综合指南
1. 交通流量数据分析
交通流量呈现出明显的双峰分布,早上 8 点和晚上 5 点左右出现高峰,这很可能是通勤交通的有力证据。西边人行道(通常用于前往西雅图市中心)早上的流量高峰更明显,而东边人行道(通常用于离开西雅图市中心)晚上的流量高峰更明显,进一步证实了这一点。
我们还可以按星期几来分析交通流量的变化,通过简单的分组操作即可实现:
by_weekday = data.groupby(data.index.dayofweek).mean()
by_weekday.index = ['Mon', 'Tues', 'Wed', 'Thurs', 'Fri', 'Sat', 'Sun']
by_weekday.plot(style=[':', '--', '-']);
这显示出工作日和周末的总流量有很大区别,周一到周五过桥的平均骑行者数量大约是周六和周日的两倍。
接下来,我们进行复合分组,查看工作日和周末的每小时流量趋势。首先按是否为周末和一天中的时间进行分组:
import numpy as np
weekend = np.where(data.index.weekday < 5, 'Weekday', 'Weekend')
by_time = data.groupby([weekend, data.index.time]).mean()
然后使用 Matplotlib 工具将结果绘制成并排的两个面
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



