Density Estimation
所谓异常检测就是发现与大部分对象不同的对象,其实就是发现离群点,异常检测有时也称偏差检测,异常对象是相对罕见的。
应用:
欺诈检测:主要通过检测异常行为来检测是否为盗刷他人信用卡。
入侵检测:检测入侵计算机系统的行为
医疗领域:检测人的健康是否异常
下面来看一个例子:
x1 : 引擎运转时产生的热量
x2 : 引擎的振动
将它们绘制成图表,假设某天新生产出一个发动机引擎,我们需要对它进行检测是否正常。如果 xtest 对应的特征向量与样本点类似,那么我们可以认为这个引擎是正常的;如果 xtest 对应的点在外面,离我们的样本点很远,则可以认为是一个异常点。
正式地定义异常检测问题:从 x(1) 到 x(m) ,我们通常假定这m个样本都是正常的,或者说都不是异常的。然后我们需要一个算法来告诉我们一个新的样本数据x-test是否是异常。我们要采取的方法是给定训练集给定无标签的训练集。我们将对数据建一个模型 p(x) ,也就是说我们将对x的分布概率建模其中 x 是这些特征变量
p(x)≥ε
,
Gaussian Density:
图像如下:
其图像看起来像是一个钟,所以也成为钟型曲线。正态分布的期望 μ 决定了曲线的中心位置,标准差 σ 决定了曲线的宽度。如 μ=1 , σ=1 ,是标准正态分布,其图像如下:
下面看几个高斯分布的图像,理解一下参数

这篇博客探讨了异常检测在欺诈检测、入侵检测和医疗领域的应用,并通过密度估计建立异常检测系统。介绍了单变量和多元高斯分布在异常检测中的作用,以及如何构建和评估异常检测系统。此外,还提到了推荐系统在机器学习中的相关概念。
最低0.47元/天 解锁文章
5301

被折叠的 条评论
为什么被折叠?



