归一化和标准化

本文详细介绍了归一化和标准化的区别。归一化将数据线性转换到[0,1]区间,适用于小数据场景,而标准化通过Z-score将数据转化为均值为0,标准差为1,适合大数据且需要考虑量纲影响的情况。标准化有助于机器学习中的某些函数和距离计算,而归一化则消除量纲影响,使不同变量可比。" 132573195,19673332,Java获取当前系统年份的方法,"['Java', '日期时间处理', 'Java 8', '开发语言']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

主要是读了这篇文章才深入理解这两个的区别

http://www.zhaokv.com/2016/01/normalization-and-standardization.html

  1. 归一化
    对原始数据进行线性转换到 [0,1] 区间,如下:

    最小值和最大值特别容易受异常值影响,因此鲁棒性不好,比较适合传统的小数据场景

  2. 标准化
    最常用的方法是Z-score标准化,即将数据转化成均值为0,标准差为1,处理方法如下:

    其中 是样本的均值, 是样本的标准差,适合已有的样本量足够大的时候使用。

  3. 理论解释
    归一化的依据非常简单,归一化可以消除量纲对结果的影响,使不同变量有可比性。

    标准化的依据相对复杂,它表示原始值和均值之间差几个标准差,是一个相对值,有去除量纲的效果,还带来了两个附加好处:均值为0,方差为1.

    均值为0可以带来很多遍历,比如在去中心化的数据上做SVD分解等价于在原始数据上做PCA;机器学习中很多函数如Sigmoid、Tanh、Softmax等都以0为中心左右分布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值