利用大数据为出租车司机选择商业可行区域及短信文学信息系统转录歧义解决机制
一、利用大数据为出租车司机选择商业可行区域
- 背景与动机
- 城市地面交通对于人们开展日常活动至关重要,在纽约,出租车是交通的重要组成部分。本文旨在利用纽约市出租车行程数据集,找出最具盈利性的区域,帮助出租车司机增加收入。
- 随着城市化和出租车服务的发展,纽约市出租车数据集的数据量变得非常庞大,传统的关系数据库管理系统难以对其进行分析。因此,本文采用Hadoop服务来有效分析如此庞大的数据集。
- 相关工作
- Hadoop分布式文件系统 :Shvachko等人描述了Hadoop分布式文件系统的架构,并报告了在搜索引擎雅虎使用HDFS管理25PB企业数据的经验。HDFS提供了DistCp工具用于大型集群间/集群内的并行复制。
- 纽约市出租车行程和票价数据集分析 :Patel和Chandan分析了纽约市出租车数据集,使用MapReduce框架来寻找最佳实践,并通过Hive和Pig技术量化上下客情况以获得司机票价。
- 交通和旅行模式分析 :Sun和McIntosh对纽约市出租车数据进行分析,提出了一个通用架构,允许用户选择所需的服务类型,并分析GPS相关数据,以提供更好的服务质量,帮助用户找到最佳的打车地点。
- 交通模式推断 </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



