45、利用大数据为出租车司机选择商业可行区域及短信文学信息系统转录歧义解决机制

利用大数据为出租车司机选择商业可行区域及短信文学信息系统转录歧义解决机制

一、利用大数据为出租车司机选择商业可行区域
  1. 背景与动机
    • 城市地面交通对于人们开展日常活动至关重要,在纽约,出租车是交通的重要组成部分。本文旨在利用纽约市出租车行程数据集,找出最具盈利性的区域,帮助出租车司机增加收入。
    • 随着城市化和出租车服务的发展,纽约市出租车数据集的数据量变得非常庞大,传统的关系数据库管理系统难以对其进行分析。因此,本文采用Hadoop服务来有效分析如此庞大的数据集。
  2. 相关工作
    • Hadoop分布式文件系统 :Shvachko等人描述了Hadoop分布式文件系统的架构,并报告了在搜索引擎雅虎使用HDFS管理25PB企业数据的经验。HDFS提供了DistCp工具用于大型集群间/集群内的并行复制。
    • 纽约市出租车行程和票价数据集分析 :Patel和Chandan分析了纽约市出租车数据集,使用MapReduce框架来寻找最佳实践,并通过Hive和Pig技术量化上下客情况以获得司机票价。
    • 交通和旅行模式分析 :Sun和McIntosh对纽约市出租车数据进行分析,提出了一个通用架构,允许用户选择所需的服务类型,并分析GPS相关数据,以提供更好的服务质量,帮助用户找到最佳的打车地点。
    • 交通模式推断 </
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值