吴恩达机器学习(十三)异常检测(高斯分布)

目录

0. 前言

1. 高斯分布(Gaussian distribution)

2. 参数估计

3. 异常检测算法(原始模型)

4. 高斯分布异常阈值的选择

5. 多变量高斯分布(多元模型)

6. 原始模型和多元模型的区别


学习完吴恩达老师机器学习课程的异常检测,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

易知,采集的数据或者数据本身,有可能出现异常,这些数据大部分会集中在一起,而有少部分会分散在周围。

一般地,采集的数据服从某种概率分布模型,例如服从高斯分布(Gaussian distribution),数据大概率的落在正常的区间范围内,而有小概率出现异常落在区间范围外。我们采用高斯分布作为数据的概率模型。

异常检测,则是对新的测试样本进行检测,判断这个样本是否是异常的。如果用概率模型 p(x) 表示,则 p(x_{test})< \varepsilon 表示数据有异常,\varepsilon 为一个很小的常数。

1. 高斯分布(Gaussian distribution)

变量 X 服从高斯分布可表示为 X\sim N(\mu,\sigma^{2}) ,其中 \mu 为均值, \sigma^{2} 为方差,概率分布有如下定义:

\large p(x;\mu,\sigma^{2})=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^{2}}{2\sigma^{2}})

2. 参数估计

通过已知的样本数据集,估计这些数据分布中的未知参数,就是参数估计。

例如,已知一样本数据集,假设数据服从高斯分布,则需要估计的参数就是 \mu 和 \sigma ,根据统计的思想,可采用下式:

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值