参数标准化 | 机器学习

本文探讨了在机器学习中为何需要对参数进行标准化,通过NumPy和Scikit-learn库展示了不同标准化方法,并强调了标准化在避免参数差异对模型影响的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 问题

机器学习的各个参数,也叫feather,可谓千差万别。在正式建模之前,需要把这些参数标准化(Normalization)。具体情况是怎样的呢?

2. 分析

还是那之前提到的房价案例为例。简单举例,影响房价的参数可能有房价大小,以平方米记,例如从50~200平方米;还有里面的房间数量,比如一室一厅就记为2,三室两厅就记为5。

显然,房间数量和平米数有数量级的差异。140平米的房子,房间数量可能只有5。如果直接用这些原始参数计算,得到的模型必然会出现,某一方的参数掩盖了另一方参数影响的情况。

我们希望能把各个参数放到同一个数量级下进行比较,这就需要用到标准化。通常,我们用以下公式操作

z i = x i − μ σ i z_i = \frac{x_i - \mu}{\sigma_i} zi=σixiμ

其中

  • μ \mu μ x i x_i xi 的期望;
  • σ \sigma σ x i x_i x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值