纽约市黄色出租车行程分析:Shell脚本实战
1. 生成包含行程时长的数据
首先,我们需要生成包含“行程时长”这一计算字段的新数据。可以使用以下命令:
robin ~/Lesson4 $./taxi6.sh <nyc_taxi.csv >nyc_taxi2.csv
为了验证操作是否按预期进行,我们可以查看新文件的前五行:
robin ~/Lesson4 $ head -n5 nyc_taxi2.csv
2017-01-09 11:13:28,2017-01-09 11:25:45,1,3.30,15.30,737
2017-01-09 11:32:27,2017-01-09 11:36:01,1,0.90,7.25,214
2017-01-09 11:38:20,2017-01-09 11:42:05,1,1.10,7.30,225
2017-01-09 11:52:13,2017-01-09 11:57:36,1,1.10,8.50,323
2017-01-01 00:00:02,2017-01-01 00:03:50,1,0.50,5.30,228
同时,我们可以查看原始文件和新文件的行数,以了解有多少无效行被剔除:
robin ~/Lesson4 $ wc -l nyc_taxi.csv
200000 nyc_taxi.csv
robin ~/Lesson4 $ wc -l nyc_taxi2.c