自学笔记:数据结构学习(01)

数据处理标准化是确保数据分析有效性的关键,通过中心化和标准化将数据转换为均值为0、标准差为1的标准分布。这一过程在回归分析和机器学习中尤其重要,因为它消除不同尺度数据的影响,便于模型训练和解释。标准化公式涉及计算每个数据点与均值的差值并除以最大值与最小值之差。在实际应用中,了解x-min和max-x的区别对于处理收益和成本问题至关重要。中心化处理在主成分分析中也有广泛应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(一)数据处理之标准化:

简介:数据处理标准化的目的在于统一数据处理的尺度,比如(x,y)双重维度的数据,如果差几个数量级那么数据分析将会毫无意义(小的一方在巨大的单位尺下毫无影响),所以才会使用标准化,使得各数据都以‘1’为单位

情景 :回归分析,以及机器学习等情景

关键词:中心化,标准化

正文:  公式如下(u为平均值,σ为Δmax-min)也可以理解为:x'=(x-min)/(max-min) (这里请思考x-min和max-x有什么区别,那么他们的用途如何?----极大极小型对应收益和成本类型问题……)

 

 如图中例子所示,我们处理的目标是均值为0,标准差为1。我们在主成分分析当中也会对数据中心化处理.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值