机器学习之异常检测

#Anomaly detection(异常检测)

这是机器学习算法的一个常见应用,虽然主要用在非监督学习问题,但从某些角度看跟监督学习问题是非常相似的。

更正式的定义:

  • 给定无标签的训练集,对数据建模即p(x),即对x的分布概率建模,对于新样本,如果p(Xtest)低于阈值ε,则将其标记为异常。

举例:

 

#Gaussian distribution(高斯分布)

也称为normal distribution(正态分布)。

  • variance parameter(方差)
  • standard deviation(标准方差)

Parameter estimation(参数估计)问题:

给定数据集,希望估算出μ和sigma平方的值。

  • 这里的估计实际上就是对μ和sigma平方的极大似然估计;
  • 在机器学习中大家喜欢用1/m

 

#Algorithm(算法)

有一个共有m个样本的无标签训练集,用数据集建立概率模型p(x),找出哪些特征量的出现概率较高或较低。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值