- 博客(2)
- 收藏
- 关注
原创 机器学习中数据标准化相关方法
拿到一批原始数据后,经过对缺失值的填补、异常值的处理以及组合型数据的生成,可以得到一份较为完整的数据集。但是不同指标具有不同的性质(连续、离散)和不同的数量级,直接进行训练会削弱数量级较低数据带来的影响,所以还需要对数据进行标准化处理(目标值通常不需要缩放),才能让数据可以投入训练。数据标准化就是把有量纲的数据变成无量纲的数据,把量级不同的数据处理到同一个量级,从而让不同纬度的数据之间具有可比性,对于机器学习来说,用来提升模型的预测效果。具体常用的标准...
2021-12-03 16:06:05
5871
原创 一维数组间皮尔逊相关系数
皮尔逊相关系数( Pearson correlation coefficient),用来验证两个变量之间的相关性,范围在-1到1之间。计算公式:相关系数的性质: 1. r的取值范围是[-1, 1]: a.若0<r<=1, 表明x与y之间存在正线性相关关系; b.若-1<=r<0, 表明x与y之间存在负线性相关关系; c. 若r=+1,...
2021-11-26 15:25:01
1446
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人