请根据每条出行记录的OD点,估算出行距离。
基于行程时间和出行距离,计算共享单车的骑行速度。
基于骑行速度的合理范围(< 25 km/h),删除不合理的出行记录。
背景
聚类分析是一种常用的数据分析方法,可以帮助我们发现数据集中的模式和群组。对于基于共享单车出行数据的交通运输数据技术,聚类分析可以帮助我们理解用户行为、优化车辆调度、改善交通规划等方面。
数据预处理
一、数据预处理(data preprocessing),使数据不同的特征具有相同的量纲
library(tidyverse)
data <- read.csv("obike_1.csv")
根据提供的共享单车出行数据的结构信息,obike是一个包含16386行和7列的数据框(data.frame)对象