- 博客(6)
- 收藏
- 关注

原创 皮尔逊相关系数Pearson Correlation Coefficient
Pearson相关性系数可以看出是升级版的欧氏距离平方,因为它提供了对于变量取值范围不同的处理步骤。因此对不同变量间的取值范围没有要求(unit free),最后得到的相关性所衡量的是趋势,而不同变量量纲上差别在计算过程中去掉了,等价于z-score标准化。而未经升级的欧式距离以及cosine相似度,对变量的取值范围是敏感的,在使用前需要进行适当的处理。在低维度可以优先使用标准化后的欧式距离或者...
2020-02-14 21:30:48
1728
转载 Note: Python中的*重复运算符
在python中有个特殊的符号“*”,可以用做数值运算的乘法算子,也是用作对象的重复算子,但在作为重复算子使用时一定要注意注意的是:*重复出来的各对象具有同一个id,也就是指向在内存中同一块地址,在对各个对象进行操作是一定要注意。举例来说:alist = [range(3)]*4alist[[0, 1, 2], [0, 1, 2], [0, 1, 2], [0, 1, 2]]上面初始化一个二层列表用来模拟矩阵,该矩阵式4X3的,为描述方便,这里记矩阵为A。现在我想给A11赋值为1,用下面
2020-07-20 18:31:54
428
原创 python深拷贝和浅拷贝的区别
首先深拷贝和浅拷贝都是对象的拷贝,都会生成一个看起来相同的对象,他们本质的区别是拷贝出来的对象的地址是否和原对象一样,也就是地址的复制还是值的复制的区别。什么是可变对象,什么是不可变对象:可变对象是指,一个对象在不改变其所指向的地址的前提下,可以修改其所指向的地址中的值;不可变对象是指,一个对象所指向的地址上值是不能修改的,如果你修改了这个对象的值,那么它指向的地址就改变了,相当于你把这个对象指向的值复制出来一份,然后做了修改后存到另一个地址上了,但是可变对象就不会做这样的动作,而是直接在对象所指的地
2020-06-12 13:30:32
183
原创 Statistics for Data Analysis
Why statisticsWhat is statistics?Statistics is the discipline that studiesthe procedure of collection, illustration(explain or prove), processing and analysis of the datahow to extract informat...
2020-02-11 10:32:37
625
原创 Jupyter Notebook
1.mac安装Jupyter Notebook终端输入pip install jupyter2.启动Jupyter1) 在终端,先cd到源代码文件目录(想要存放的Jupyter源代码目录)然后输入jupyter notebook终端会启动一个web服务,网页地址:http://localhost:8888/?token=b0d62c4a89c7e84e68be06198df971a751...
2020-02-08 11:34:39
396
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人