传感器数据流特征提取与社交网络特征生成
1. 传感器数据流特征提取
在传感器数据流的处理中,ODSS(Online Discrete Symbolic Segmentation)展现出了强大的能力。它能够对一组未标记的路线进行聚类,在处理实际 GPS 数据集时,其聚类效果至少与基于动态时间规整(DTW)的等效聚类方法相当。
ODSS 的优势还体现在数据转换方面。它可以将连续数据转换为离散表示,对于该数据集,实现了约 40:1 的降维。而且这种转换可以在线进行,无需批量处理,也不需要事先定义符号集。
在离散表示的基础上,可以应用成熟的相似度度量——杰卡德系数(Jaccard coefficient),进而进行层次聚类。尽管 ODSS 的表示分辨率较低,但它仍能成功识别路径中的微小变化,这在分析弱势群体的行为时尤为重要。
ODSS 还是实时识别系统的基础。该系统使用杰卡德系数,将部分(正在进行的)行为与先前行为的模型进行比较。通过滑动窗口方法,将本文描述的方法应用于实时场景,使得在从数据流中提取符号时能够反复进行行为评估,从而快速检测出异常行为,无需等待行程结束。
2. 社交网络特征生成
随着网络数据的不断增加,对社交网络数据进行挖掘的需求也日益增长。社交网络分析(SNA)在社会学领域有着悠久的历史,常用的分析方式包括中心性分析、角色分析以及团簇分析等,这些分析会产生网络、节点或边的相关指标。
在链接挖掘中,基于链接的分类是一项热门任务。目前已经有众多针对链接分类的方法,但对于有效生成社交网络特征的研究还不够全面。
超级会员免费看
订阅专栏 解锁全文
1729

被折叠的 条评论
为什么被折叠?



