基于网络数据的交通分析系统:架构、模型与应用
1. 交通情感分析与监测系统
基于特定的系统架构和主要技术,开发了一个交通情感分析与监测系统,该系统已部署在中国青岛和其他几个城市。此系统具备交通事件检测、交通情感分析以及交通场景分析与概况等功能。
青岛交通情感分析与监测系统部署在青岛交通运输管理机构。借助该系统,可以从新浪微博、青岛本地在线论坛、报纸、交通机构网站、论坛等渠道提取交通事件以及市民对青岛交通系统的看法。系统每小时能够收集400万条在线网络数据。
2. 交通事件检测
2.1 检测方法
从微博帖子中检测交通事件时,首先使用手动选择的关键词搜索微博帖子,然后使用深度学习模型将搜索到的帖子分类为与交通相关和与交通无关的两类。用于搜索新浪微博的关键词包括:拥堵、交通事故、擦碰、事故、绕行、撞车、交通堵塞、交通状况、交通规则等。
为了开发用于检测交通事件的LSTM - CNN模型,建立了一个包含11,000个样本的数据集。在实验中,词序列的最大长度设置为156,并使用零填充来填充序列。词嵌入的维度设置为200。为了获取词嵌入,收集了2009年至2011年间涵盖170,000个用户账户的30亿条微博帖子,并使用CBOW模型来获取捕捉词语义的词嵌入。
2.2 性能指标
为了评估模型的性能,采用了三个指标:精确率(Precision)、召回率(Recall)和F - 度量(F - measure)。
- 精确率公式:$Precision = \frac{TP}{TP + FP}$
- 召回率公式:$Recall = \frac{TP}{TP + FN}$
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



