中心化(又叫零均值化)和标准化(又叫归一化)概念及目的
目的:消除数据间量纲的差异
方法:中心化:减去均值;归一化:(1)减去均值并除以方差使之服从N(0,1)分布;(2)修改样本使之数值分布在[0,1]
标准化是中心化的进一步处理
归一化与中心化都可能提高精度;归一化使随机下降的速度加快;标准化更好的反应数据的特征。
本文深入探讨了数据预处理中的核心概念——中心化与标准化,详细解释了这两种方法的目的与实施步骤,旨在帮助读者理解如何通过数据预处理消除量纲差异,提升机器学习模型的精度与效率。
中心化(又叫零均值化)和标准化(又叫归一化)概念及目的
目的:消除数据间量纲的差异
方法:中心化:减去均值;归一化:(1)减去均值并除以方差使之服从N(0,1)分布;(2)修改样本使之数值分布在[0,1]
标准化是中心化的进一步处理
归一化与中心化都可能提高精度;归一化使随机下降的速度加快;标准化更好的反应数据的特征。
3749

被折叠的 条评论
为什么被折叠?