纽约出租车大数据探索

本文通过对145万纽约出租车数据的分析,探讨了打车需求高峰期、夜生活活跃度、交通拥堵时刻及长途单出现时间。1月和5月末的低值因天气和特殊事件影响,周五周六打车频率最高,夜间23点后订单减少,早晨5点最低。此外,凌晨时段最易接到长途单。未来可进一步研究天气、地区特征等因素对订单的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文旨在探索纽约城市市民的打车出行习惯,通过对145万余条数据的定量分析,针对提出的问题相应地得出了些许结论。并在文末分析了日后可以进一步拓展的探索方向。
数据来自于kaggle,选用train.csv中的数据记录进行相关数据分析,使用Python作为分析工具。

数据来源:Kaggle|New York City Taxi Trip Duration

也可参考纽约市出租车和轿车委员会发布的历史数据集: NYC|(TLC Trip Record Data

过程设计:

  • 提出问题
  • 理解数据
  • 数据清理
  • 数据分析
  • 得出结论

一、提出问题

根据已有数据分析:

1、何时为打车需求高发期?

2、居民夜生活活跃情况?

3、城市一天的什么时候最为拥堵?

4、什么时间容易接到长途单?


二、了解数据

表单说明:

id - 每次行程的唯一ID

vendor_id - 行程提供者的ID

pickup_datetime - 上车的日期和时间

dropoff_datetime - 停表的日期和时间

passenger_count - 车辆中的乘客数量(驾驶员输入值)

p

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值