3、空间属性数据的异常检测

空间属性数据的异常检测

1. 空间离群点检测概述

在处理具有空间属性的数据时,离群点的稀疏邻域可能是由于与已识别离群点接近的许多对象被分配到其他分区导致的。这满足了空间离群点的条件,即其值属性与局部邻域形成鲜明对比。不过,这种方法可能会产生误报。分区特定离群点的稀疏邻域也可能是由于整个数据集(跨分区)的普遍稀疏性,而不是邻域对象被分配到其他分区。因此,需要设计一个后处理步骤来排除由前者而非后者因素导致的分区特定离群点。此外,此阶段将分区中的所有对象在值属性上视为相同,这可能会导致遗漏一些真正的离群点。虽然将一般离群点检测方法应用于空间数据的研究不多,但最近将局部离群因子(LOF)应用于空间数据的方法值得关注。

2. 空间离群点检测方法:SLOM

空间离群点检测方法旨在识别其值属性与其指定空间上下文形成鲜明对比的对象。常见方法是估计偏差分数,即将对象的值属性与其空间邻居的值属性进行比较,空间邻居构成上下文。下面重点介绍SLOM方法。
- SLOM步骤
1. 定义上下文 :对于网格化或镶嵌数据,每个对象的上下文是其空间邻居的集合;对于非网格化的多维点对象数据集,上下文可以定义为k近邻(kNN)对象的集合。
2. 计算修剪均值 :计算对象的修剪均值$Q_d$,即对象与其上下文中对象在值属性上的平均距离,忽略距离最大的上下文对象以降低对噪声的敏感性。同时,计算上下文中所有对象的修剪均值,并求其平均值$avgtm(d)$:
$avgtm(d) = average{Q_d(c)|c \in {context(d) \cup d}}$ <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值