吴恩达机器学习笔记 三十三 发现异常事件 高斯分布

本文探讨了在飞机发动机异常检测中,利用密度估计方法来识别新样本与训练数据显著偏离的情况。通过计算高斯分布的概率,当验证样本的概率低于阈值时,将其标记为异常点。μ和σ参数在该过程中扮演关键角色,展示了如何使用统计学原理进行异常检测分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

例如飞机发动机的异常检测,假设只有两个特征,新的样本和之前的样本偏离的很多,就认为可能是异常的点。

一种方法是密度估计(density estimation),计算训练样本的 x 落在某个区间的概率,当验证集的样本的概率小于一个很小的数时,认为这种情况是异常的。

 

高斯分布(Guassian distribution,也叫正态分布,normal distribution,钟形分布,bell-shape distribution)

如下图,这个曲线以 μ 为中心,表示的是 p(x),σ是标准差。

几个高斯分布的例子

 μ 和 σ如下图所示,其中有些统计学家会用1/m-1替换1/m, 但这不是很重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值