说明
输入:一个CSV文件
输出:一个CSV文件,添加了距离“DSITANCE”字段
编程语言:python
主要使用库:pandas、haversine
自定义参数:输入输出路径、有效经纬度范围、分块大小、距离过滤条件
数据参数说明
名称 | 说明 |
---|---|
START_TIME | 开始时间 |
START_LAT | 开始纬度 |
END_TIME | 结束时间 |
END_LNG | 结束经度 |
USER_ID | 用户id |
END_LAT | 结束纬度 |
START_LNG | 开始经度 |
python源码
import os
import pandas as pd
from haversine import haversine, Unit
# 设置输入输出文件
input_path = '../../data/with_distance/data3_wd.csv'
output_path = '../../data_cleaned/data3_cleaned.csv'
# 定义有效经纬度范围
MIN_LNG, MAX_LNG = 113.751647, 114.622924
MIN_LAT, MAX_LAT = 22.400047,