基于Twitter数据的实时交通状况检测与可视化
1. 引言
社交网络网站如Facebook、Instagram、Twitter等越来越受欢迎,促使更多人使用这些网络与他人建立联系,并将其作为信息来源。它们成为了丰富的非结构化数据来源,用户会实时分享各种主题的信息,还能在各自的社交群体或社区中轻松交流。
Twitter拥有超3.3亿活跃用户,每天产生超5亿条推文,每日数据量超12TB。若能合理挖掘这些数据,将成为极有价值的信息源。其“发生了什么?”这一提问精准概括了平台分享身边事的核心目标。本文利用Twitter数据实时检测事件,尤其聚焦交通相关事件,如拥堵、事故、改道等,相比其他研究,具有更高的检测精度。
由于推文高度非结构化,需运用预处理、分类、命名实体识别等文本挖掘技术将其转化为结构化信息,以便进一步分析。本文旨在构建一个系统,处理非结构化数据,实时检测事件,并在城市地图上进行可视化展示,该模型也可应用于其他领域。
2. 研究动机与贡献
- 研究动机 :在大多数大城市,交通是严重问题。许多人每天走相同路线上班,高峰时段交通拥堵严重。道路堵塞、事故、施工等导致的改道会加剧拥堵。及时检测这些事件并通知通勤者,可节省时间、燃料和人力。谷歌地图虽能检测实时交通,但依赖移动设备数据,若道路阻塞且车流量少,或特定路线被警方封锁,可能无法检测并提供替代路线。本文提出的系统可用于检测交通事件,还能拓展到检测社会动荡、灾难等事件中的压力区域。
- 主要贡献 :
- 对预处理后的推文进行分类,能高精度判断是否包含交通相
超级会员免费看
订阅专栏 解锁全文
1198

被折叠的 条评论
为什么被折叠?



