Density Estimation
所谓异常检测就是发现与大部分对象不同的对象,其实就是发现离群点,异常检测有时也称偏差检测,异常对象是相对罕见的。
应用:
欺诈检测:主要通过检测异常行为来检测是否为盗刷他人信用卡。
入侵检测:检测入侵计算机系统的行为
医疗领域:检测人的健康是否异常
下面来看一个例子:
x1 : 引擎运转时产生的热量
x2 : 引擎的振动
将它们绘制成图表,假设某天新生产出一个发动机引擎,我们需要对它进行检测是否正常。如果 xtest 对应的特征向量与样本点类似,那么我们可以认为这个引擎是正常的;如果 xtest 对应的点在外面,离我们的样本点很远,则可以认为是一个异常点。

正式地定义异常检测问题:从 x(1) 到 x(m) ,我们通常假定这m个样本都是正常的,或者说都不是异常的。然后我们需要一个算法来告诉我们一个新的样本数据x-test是否是异常。我们要采取的方法是给定训练集给定无标签的训练集。我们将对数据建一个模型 p(x) ,也就是说我们将对x的分布概率建模其中 x 是这些特征变量

p(x)≥ε
,
Gaussian Density:
图像如下:
其图像看起来像是一个钟,所以也成为钟型曲线。正态分布的期望 μ 决定了曲线的中心位置,标准差 σ 决定了曲线的宽度。如 μ=1 , σ=1 ,是标准正态分布,其图像如下:
下面看几个高斯分布的图像,理解一下参数