outlier detection
joyceying小洲
个人博客请访问www.xiaozhou3l.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OD学习5-高维数据异常检测
{blog framework}feature bagging实例# -*- coding: utf-8 -*-"""Example of using Feature Bagging for outlier detection"""# Author: Yue Zhao <zhaoy@cmu.edu># License: BSD 2 clausefrom __future__ import divisionfrom __future__ import print_functio原创 2021-01-25 00:22:58 · 781 阅读 · 0 评论 -
OD学习4-基于相似度的异常检测
基于相似度的异常检测①基于距离度量代表算法:KNN算法(K近邻【在本人的博客OD学习1中有提及】)②基于密度度量代表算法:LOF以及基于lof算法优化的loci等算法以下给出赵越老师的lof算法实例# -*- coding: utf-8 -*-"""Example of using LOF for outlier detection"""# Author: Yue Zhao <zhaoy@cmu.edu># License: BSD 2 clausefrom __futu原创 2021-01-21 17:36:10 · 434 阅读 · 0 评论 -
OD学习3-线性模型
PCA实例# -*- coding: utf-8 -*-from __future__ import divisionfrom __future__ import print_functionimport osimport sysimport unittest# noinspection PyProtectedMemberfrom numpy.testing import assert_allclosefrom numpy.testing import assert_array_le.原创 2021-01-18 21:24:00 · 409 阅读 · 1 评论 -
OD学习2-调用PyOD运行HBOS算法
HBOS是一种单变量方法的组合,不能对特征之间的依赖关系进行建模,但是计算速度较快,对大数据集友好。HBOS的基本假设是数据集的每个维度相互独立。对每个维度进行区间划分,区间的密度越高,异常评分越低。HBOS算法流程为每个数据维度做出数据直方图。对分类数据统计每个值的频数并计算相对频率。对每个维度都计算了一个独立的直方图,其中每个箱子的高度表示密度的估计。然后为了使得最大高度为1(确保每个特征与异常值得分的权重相等),对直方图进行归一化处理。参考代码:from __future__ impo原创 2021-01-15 22:12:17 · 685 阅读 · 0 评论
分享