1、数据获取
数据集来源:https://www.kaggle.com/pronto/cycle-share-dataset
trip.csv字段描述
trip_id | starttime | stoptime | bikeid | from_station_id | to_station_id | usertype | gender | birthyear |
订单编号 | 骑行开始时间 | 骑行结束时间 | 骑行编号 | 出发站编号 | 到达站编号 | 用户类型 | 性别 | 出生年月 |
weather.csv字段描述
date | temperature | dew_point | humidity | sea_pressure | visibility_miles | wind_speed | precipitation_in |
日期 | 温度 | 露点 | 湿度 | 海平面气压 | 能见度 | 风速 | 降水量 |
2、分析内容
1)共享单车一天中那个时间段使用人数最多?
2)工作日和非工作日使用情况?
3)一年中每个月份使用的情况如何?
4)会员与非会员 对共享单车需求量情况?
5)使用共享单车男女比例如何?
6)使用共享单车的年龄分布如何?
7)天气因素,如温度,湿度,能见度等,对共享单车使用情况有什么影响?
3、步骤
3.1 导入数据
3.2 查看数据
3.3 数据清洗
1)删除冗余字段