令A是数值属性,具有n个观测值
。
最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值
和最小值
。最小—最大规范化通过计算:
映射到
区间中。
最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
2、 z分数(z-score)规范化(或零均值规范化)
在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值
被规范化为
,由以下公式计算:
和
分别为属性A的平均值和标准差。
当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
3、小数定标规范化
小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值
被规范化为
,由下式计算:
的最小整数。
1、 最小—最大规范化
最小—最大规范化对原始数据进行线性变换。假设和分别为属性A的最大值
把A的值
最小—最大规范化保持原始数据值之间的联系,但是如果今后的输入实例落在A的原数据值域之外,则该方法将面临“越界”错误。
2、 z分数(z-score)规范化(或零均值规范化)
在z分数规范化中,属性A的值基于A的均值和标准差规范化。A的值
其中
当属性A的实际最小值和最大值未知,或者离群点左右了最小—最大规范化时,该方法是有效的。
3、小数定标规范化
小数定标规范化通过移动属性A的值的小数点位置进行规范化。小数点的移动位数依赖于A的最大绝对值。A的值
其中,j是使得

本文介绍了数据处理中常见的三种规范化(标准化)方法,包括最小-最大缩放、Z-score标准化和归一化。这些方法对于消除数据尺度影响、提高算法性能至关重要。通过对数据进行预处理,可以确保不同特征在同一尺度上,从而提升模型的训练效果。

被折叠的 条评论
为什么被折叠?



