2、空间属性数据的异常检测技术解析

空间属性数据的异常检测技术解析

1. 问题定义

在处理空间数据的异常检测问题时,需要以一种通用的方式来定义问题,以便大多数异常检测技术都能适用。

考虑一组对象 $D = {d_1, d_2, \cdots, d_n}$,其中每个对象 $d_i$ 可以由预定义模式中的一组属性值表示:
$d_i = [s_{i1}, s_{i2}, \cdots, s_{im_s}, v_{i1}, v_{i2}, \cdots, v_{im_v}]$

这里,前 $m_s$ 个属性被指定为空间属性,其余的 $m_v$ 个属性为非空间属性,我们将非空间属性称为值属性。例如,在图 1 的示例中,每个单元格是一个数据对象,其空间属性是由 $x$ 和 $y$ 坐标定义的空间位置,而单个值属性表示温度。在流行病研究中,数据点可能是人,其空间属性是地理坐标,值属性是一个布尔属性,表示是否患病。在天气建模中,温度、湿度等可能构成不同的值属性。

此外,异常识别方法使用基于数据点空间属性定义的接近度概念。对于网格单元形式的数据,接近度度量可以简单地是邻接矩阵,用于确定一组单元是否相连。对于点形式的数据,这可能是在空间属性上定义的相似性度量。

异常检测的问题是识别一组异常 $A = {A_1, A_2, \cdots, A_k}$,使得每个集合 $A_i \subseteq D$ 符合以下标准:
- 空间连贯性 :$A_i$ 中的对象集合满足在空间属性上定义的连贯性条件。例如,它们是空间属性定义的空间内圆形或椭圆形区域中的唯一对象,或者它们在网格数据集中形成一组相连的单元。
- 与上下文的对比

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值