归一化normalization:
称为线性函数归一化,归一化到【0, 1】范围内,当然也包括非线性函数归一化
标准化standardization:
又被称为0均值归一化,归一化到0均值,方差为1的数据集中,公式中符号代表原始数据集的方差和均值
两者本质都是一种线性变换
区别是归一化仅有极值决定,将数据压缩到【0,1】范围内,而标准化则是动态的,弹性的,和样本的整体分布有关
这两种归一化的应用场景分别是怎么样的呢?什么时候第一种方法比较好、什么时候第二种方法比较好呢?
对输出结果范围有要求,用归一化。<

数据标准化和归一化是两种常见的数据预处理技术,它们都是线性变换,但应用场景不同。归一化常用于输出范围有限制的情况,而标准化适合存在异常值和噪声的数据,尤其在距离度量、PCA等场景下。概率模型如决策树不需要归一化,而 SVM、线性回归等因涉及梯度下降和距离计算,通常需要归一化以加速收敛和提高精度。
最低0.47元/天 解锁文章
731

被折叠的 条评论
为什么被折叠?



