移动社交网络与办公网络安全的创新解决方案
1. 移动社交网络节点聚类方法
1.1 研究背景
随着移动社交网络服务(MSNS)的发展,收集了大量用户的日常定位信息。然而,现有的相关研究存在不足,如一些研究主要关注移动终端的架构和应用,缺乏数据深度分析;部分基于用户共现识别用户群体的研究,数据样本小且扩展性未验证;传统地理数据挖掘方法依赖连续密集的GPS轨迹,在实际MSNS应用中不可行,且社交网络数据存在节点活跃度低、数据高维时空稀疏等特点。
1.2 解决方案
为解决上述问题,提出了一种基于时间热力图(THM)的节点聚类方法。该方法通过对定位记录的时间戳信息进行分析,将记录按选定的时间间隔聚合,得到时间热力图,以描述节点在不同时间间隔的平均活动水平,从而降低数据维度。
1.3 数据与算法
1.3.1 匿名原始数据
数据来自中国的一个MSNS服务,经过匿名处理。在11个月内,收集了约17,000名用户的60多万条定位记录,每条记录包含匿名用户ID、位置ID和时间戳,位置还带有类别字段。
1.3.2 时间热力图(THM)的定义
THM是一个归一化向量,通过将时间戳字段划分为若干周期性间隔(如24小时)并汇总相应记录得到,可指示活动水平分布。对于给定节点i在时间间隔tj的记录总数nij,其时间热力图的定义为:
[v_{ij} \triangleq \frac{n_{ij}}{\sum_{j=1}^{M} n_{ij}}],其中(1 \leq j \leq M)。
本文使用“每日小时”THM,将每天划分为24个小时间隔并按小时信息聚合
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



