离群点检测概述
离群点是观察的数据集中明显异常的数据点,或者说,离群点的数据分布与数据集的整体分布不同。离群点检测的目的是检测出那些与正常数据差别较大的数据点,然后根据具体的问题作进一步处理。针对故障诊断问题,该方法可识别偏离正常状态的对象。

说明:
1)离群点不同于噪声,非噪声点也可能离群,噪声应该在离群点检测前完成去除。2)离群点检测算法的评价指标同二分类,可使用正确率(Accuracy)、查准率(Precision)、查全率(Recall)、F值(F1-scores)等指标进行评估,或者用ROC图。
以上转自https://blog.youkuaiyun.com/Albert201605/article/details/118341478
LOF算法原理
局部离群因子LOF是用于表征被检测点的离群程度,即LOF越大,离群越明显。
假设点集X, ∀ p ∈ X \forall p\in X ∀p∈X,点p的LOF记为
L O F m ( p ) = 1 ∣ N m ( p ) ∣ ∑ o ε N m ( p ) l r d m ( o ) l r d m ( p ) LOF_{m}\left( p\right)=\dfrac{1}{\left| N_{m}\left( p\right) \right| }\sum _{o{\varepsilon }N_{m}\left( p\right) }\dfrac{lrd_m(o)}{lrd_m(p)} LOFm(p)=∣Nm(p)∣1oεNm(p)∑

最低0.47元/天 解锁文章
1851

被折叠的 条评论
为什么被折叠?



