数据标准化和归一化

数据标准化和归一化是两种常见的数据预处理技术,它们都是线性变换,但应用场景不同。归一化常用于输出范围有限制的情况,而标准化适合存在异常值和噪声的数据,尤其在距离度量、PCA等场景下。概率模型如决策树不需要归一化,而 SVM、线性回归等因涉及梯度下降和距离计算,通常需要归一化以加速收敛和提高精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

归一化normalization:称为线性函数归一化,归一化到【0, 1】范围内,当然也包括非线性函数归一化

标准化standardization又被称为0均值归一化,归一化到0均值,方差为1的数据集中,公式中符号代表原始数据集的方差和均值

两者本质都是一种线性变换

区别是归一化仅有极值决定,将数据压缩到【0,1】范围内,而标准化则是动态的,弹性的,和样本的整体分布有关

这两种归一化的应用场景分别是怎么样的呢?什么时候第一种方法比较好、什么时候第二种方法比较好呢?

对输出结果范围有要求,用归一化。<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值