自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 #异常检测——高维数据异常检测

1、引言在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积)会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异常检测带来了挑战,对距离的计算,聚类都带来了难题。例如基于邻近度的方法是在所有维度使用距离函数来定义局部性,但是,在高维空间中,所有点对的距离几乎都是相等的(距离集中),这使得一些基于距离的方法失效。在高维场景下,一个常用的方法是子空间方法。集成是子空间思想中常用的方法之一,可以有效提高数据挖掘算法精度。集成方法将多个算法或多个基检测器的输出结合起来

2021-05-23 21:20:34 359

转载 np.array()和np.mat()区别

1. 生成数组所需格式不同mat可以从字符串或列表中生成;array只能从列表中生成2. 生成的数组计算方式不同(1)array生成数组,用np.dot()表示矩阵乘积,(*)号或np.multiply()表示点乘(2)mat生成数组,(*)和np.dot()相同,点乘只能用np.multiply()...

2021-05-22 11:32:01 252

原创 if __name__ == ‘__main__‘

同一个目录下写建俩py意思是说自己文件(a.py)执行自己时name就是main,所以程序先执行了d()再执行了main()。而自己文件(a.py)被别人执行时(b.py),name值为a(模块名),故if namemain下面不执行,只执行d()函数。总结:if namemain是判断某程序是自己执行自己、还是自己被别人执行,若是前者可以显示if下面代码,若是后者就不执行啦...

2021-05-21 17:33:47 140

原创 异常检测——线性相关方法

1、引言  真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。在古典统计学中,这被称为——回归建模,一种参数化的相关性分析。     一类相关性分析试图通过其他变量预测单独的属性值,另一类方法用一些潜在变量来代表整个数据。前者的代表是 线性回归,后者一个典型的例子是 主成分分析。本文将会用这两种典型的线性相关分析方法进行异常检测。  需要明确的是,这里有两个重要的假设:  假设一:近似线性相关假设。线性相关假设是使用两种模型进行异常检测的

2021-05-19 11:00:18 230

原创 2021-04-24

1.geopandas安装见[https://zhuanlan.zhihu.com/p/137628480]第一条评论(https://zhuanlan.zhihu.com/p/137628480)pip install wheelpip install pipwinpipwin install numpypipwin install pandaspipwin install shapelypipwin install gdalpipwin install fionapipwin inst

2021-04-24 17:03:16 450 1

转载 python 一个.py文件如何调用另一个.py文件中的类和函数

在同一文件夹下调用函数:A.py文件:def add(x,y): print('和为:%d'%(x+y))B.py文件:import AA.add(1,2)或者from A import addadd(1,2)调用类:A.py文件:class A: def __init__(self,xx,yy): self.x=xx self.y=yy def add(self): print("x和y的和为:%d"%(

2020-10-05 09:43:46 331

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除