基于位置的社交网络中的事件检测技术
1. 引言
传感器网络由大量空间分布的自主设备组成,能监测周围环境并与相邻设备通信。检测其中的异常行为在通信和数据挖掘等领域备受关注,这种检测和刻画随时间出现的异常测量子组的任务被称为事件检测,在监控系统、环境监测和城市交通等方面有广泛应用。
社交网络最初用于用户通信,但随着移动技术和定位系统的发展,用户成为了无处不在的传感器,能够监测和报告现实世界的事件,如音乐会、地震和政治示威等。基于位置的社交网络,特别是 Twitter,在事件检测方面表现出色,甚至比传统媒体更快。例如,孟买恐怖袭击和本·拉丹死亡的消息都是先在 Twitter 上曝光的。
社交网络产生了大量的异构数据,事件检测需要应对大数据的 5V 特性:体积、速度、多样性、真实性和可变性。本文将介绍两种回顾性事件检测技术,即从历史数据中发现事件,不考虑数据的速度因素。这两种技术通过独立建模推文的空间、时间和文本维度来处理推文的多样性,也可扩展以考虑其他形式的数据。
2. 问题定义
社交网络中的事件检测缺乏正式的事件定义。一种定义认为事件是在特定时间和地点发生的重要事情,但未明确“重要”在社交网络中的含义。另一种定义认为事件是在在线社交网络中引起大量行动的事物,但仍缺乏对“大量行动”的形式化定义。我们在此基础上,将事件定义为在在线社交网络中引起异常数量行动的事物,这与传感器网络中的事件检测定义相似,能捕捉更复杂的事件,如社交网络中行动的异常减少。
基于位置的社交网络使事件检测聚焦于地理定位事件,有助于识别现实世界中的各种事件,特别是城市环境中的本地事件。事件检测的任务是识别和刻画相对于基线的异常事件集,可以是回顾性的(从历史
超级会员免费看
订阅专栏 解锁全文
3121

被折叠的 条评论
为什么被折叠?



