数据洞察:变异性、不确定性与背景的力量
变异性:数据中的多彩乐章
数据的变异性就像夜空中闪烁的萤火虫,看似随机,实则蕴含着独特的规律。德国业余摄影师兼物理学家克里斯蒂安·切韦克(Kristian Cvecek)在夜间拍摄萤火虫,长曝光照片揭示了它们飞行路径的模式。尽管每一刻的飞行位置看似随机,但整体呈现出沿着路径和绕树飞行的趋势。这种变异性让萤火虫的飞行变得有趣,也让照片更加美丽。
在数据分析中,变异性同样重要。以美国2001 - 2010年的致命车祸数据为例:
- 总体数据的局限 :国家公路交通安全管理局(NHTSA)报告显示,这期间共有363,839起致命车祸。仅关注这一总数,能引发对生命的思考,但无法深入了解数据背后的故事。
- 不同粒度的数据洞察
- 地理分布 :将每起事故标注在地图上,可看出大城市和主要高速公路事故更集中,而人口和道路少的地区事故较少。
- 时间维度
- 年度变化 :每年事故仍达数万起,但2006 - 2010年显著下降,每1亿英里行驶里程的死亡率也降低。
- 季节周期 :按月分析,夏季事故增多,冬季减少,且每年如此。
- 每日变化 :每日事故存在波动,但有周末事故增多的规律,高峰日在周五、周六和周日间波动。
- 每小时变化 :按小时分析较难看出规律,但聚合后能发现早晨通勤时事故有小高峰,傍晚下班
超级会员免费看
订阅专栏 解锁全文
771

被折叠的 条评论
为什么被折叠?



