异常检测(三)——Local Outlier Factor(LOF)

局部异常因子(LOF)是一种在中等高维数据集上执行异常值检测的有效方法。算法通过比较样本点与其周围点的相对密度来确定异常程度。LOF值越大,表示该点可能越异常。本文介绍了LOF的算法思想、理论、关键参数和使用sklearn的实例。

在中等高维数据集上执行异常值检测的另一种有效方法是使用局部异常因子(Local Outlier Factor ,LOF)算法。

1、算法思想

LOF通过计算一个数值score来反映一个样本的异常程度。这个数值的大致意思是:一个样本点周围的样本点所处位置的平均密度比上该样本点所在位置的密度。比值越大于1,则该点所在位置的密度越小于其周围样本所在位置的密度,这个点就越有可能是异常点。关于密度等理论概念,详见下面第二部分。

2、LOF的具体理论

关于LOF的理论,可以参考这篇文章,写的非常详细具体!

3、LocalOutlierFactor主要参数和函数介绍

class  sklearn.neighbors. LocalOutlierFactor ( n_neighbors=20 algorithm=’auto’
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值