基于位置的社交网络事件检测与油气管道安全评估
基于位置的社交网络事件检测
在基于位置的社交网络中,事件检测是一个重要的研究领域。为了从 Twitter 中识别和描述一组有趣的事件,研究人员采用了结合概率方法和学习理论的计算智能方法。
两种事件检测技术
- WARBLE :这是一种基于机器学习的技术,基于异构混合模型。它可以定义更丰富的背景模型,考虑到季节性和不均匀的人口密度,但事件的时空形状明确限制为高斯分布。
- Tweet - SCAN :这是一种类似 DBSCAN 的事件检测算法,将事件定义为在空间、时间和文本维度上具有密度连接的推文集合。该技术允许发现任意形状的事件,但将“正常性”的定义简单地限制为推文的稀疏区域,并且没有数据生成过程的概念。
实验结果表明,两种技术的性能相似,不过 WARBLE 稍好一些。对于 Tweet - SCAN,当纳入文本和用户特征时,其性能会有显著提升。而且,这两种技术都明显优于地理主题模型。
可扩展性
这两种方法都可以通过分布式处理框架(如 Apache Spark)扩展到大规模数据。Tweet - SCAN 的并行版本将数据分割成单独的分区,这些分区可以位于不同的计算机上,进行本地事件检测并随后合并,以获得与顺序版本相同的结果。WARBLE 的扩展得益于随机优化,避免将所有数据缓存在内存或同一本地机器中。此外,像 Splash 这样的通用框架可以在 Apache Spark 之上实现并行和分布式学习。
以下为两种技术的特点对比表格: <
超级会员免费看
订阅专栏 解锁全文
89

被折叠的 条评论
为什么被折叠?



