无监督学习算法:异常检测与聚类技术解析
1. 无监督学习算法概述
随着大量未标记数据的激增,无监督学习算法受到了研究人员和从业者的广泛关注。这些算法能够自动发现数据中有趣且有用的模式,在模式识别、市场篮分析、网络挖掘、社交网络分析、信息检索、推荐系统、市场研究、入侵检测和欺诈检测等众多领域都有应用。过去半个世纪,由于开发理论上可靠且易于客观评估的方法存在困难,涌现出了大量的无监督学习算法。
2. 异常检测相关技术
2.1 空间属性数据的异常检测
异常通常指偏离正常情况的事物,对于具有空间属性的数据,空间上连贯且行为异常的组是我们关注的重点。例如,在一个地理区域的网格数据中,大部分单元格温度较低,但有两个区域温度较高,这两个区域就可被视为异常。
而离群点是一个更精细的概念,它衡量的是单个对象的异常行为。对于离群点的定义,没有统一的标准,不同应用可能会选择与局部邻域或全局行为进行对比。
在检测具有空间属性数据的异常区域方面,不同领域有不同的方法:
|类别|方法|描述|
| ---- | ---- | ---- |
|对象异常|通用离群点检测方法、特定文献方法|考虑通用离群点检测方法对识别空间数据异常区域的适用性,并介绍文献中专门为该任务提出的方法|
|全局区域异常|空间扫描等统计方法、挖掘方法|识别与全局行为不同的区域,包括统计领域的空间扫描方法和一些挖掘方法|
|局部区域异常|局部同质异常(LHA)检测方法、图像分割方法|寻找与局部邻域行为相比异常的区域,包括LHA检测方法和图像分割方法|
|区域分组异常|空间数据分组方法、入侵检测中的聚类异常检测方法|将
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



