异常检测技术全解析
1 异常检测概述
在数据处理中,为数据提供标签时,给出正常实例的示例通常更为容易。这是因为异常情况的发生方式众多,要找到不同类型异常的示例十分困难。而且,异常行为往往具有动态性,例如可能会出现新的异常类型,而针对这些新异常却没有标注好的训练数据。在某些特定场景,如航空安全领域,异常实例可能意味着灾难性事件,因而极为罕见。
基于标签的可获取程度,异常检测技术可分为以下三种模式:
1. 监督式异常检测 :假定训练数据中同时包含正常和异常行为的样本。不过,由于异常事件的先验概率通常极小,获取具有代表性的异常行为训练数据往往不可行,所以这类方法的应用范围有限。
2. 半监督式异常检测 :一般假设训练数据仅代表正常行为。其常用方法是构建一个描述正常行为的统计或机器学习模型,然后通过统计或邻近性测试来识别与该模型不符的新实例。
3. 无监督式异常检测 :无需标签信息,直接从数据中发现异常。
| 检测模式 | 数据要求 | 方法特点 | 应用局限 |
|---|---|---|---|
| 监督式 | 包含正常和异常行为样本 | 可利用多种分类方法处理 | 难以获取代表性异常数据 |
| 半监督式 | 仅含正常行为样 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



