27、机器学习中的数据处理与评估指标

机器学习中的数据处理与评估指标

在机器学习领域,数据处理和模型评估是至关重要的环节。本文将详细介绍数据归一化技术、常用的评估指标,以及线性回归等相关内容。

数据归一化技术

数据归一化是将数据转换为统一尺度的过程,这有助于提高在数据集上训练模型时所采用算法的准确性。以下是一些常见的数据归一化技术:
1. 标准化(Standardization) :假设数据符合标准正态分布,通过对每个数据点减去均值并除以标准差,使数据转换为均值为 0、标准差为 1 的标准正态分布。在 Sklearn 中可使用以下代码实现:

from sklearn.preprocessing import StandardScaler
  1. 归一化(Normalization) :这是一种线性缩放技术,将数据集 $X$ 中的元素缩放到 0 到 1 的范围。计算公式为 $X_i = (X_i – Min_x)/[Max_x – Min_x]$,其中 $Min_x$ 是 $X_i$ 的最小值,$Max_x$ 是 $X_i$ 的最大值。Sklearn 中对应的类为:
from sklearn.preprocessing import Normalizer
  1. 最小 - 最大缩放(Min - Max Scaling)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值