机器学习中的数据处理与评估指标
在机器学习领域,数据处理和模型评估是至关重要的环节。本文将详细介绍数据归一化技术、常用的评估指标,以及线性回归等相关内容。
数据归一化技术
数据归一化是将数据转换为统一尺度的过程,这有助于提高在数据集上训练模型时所采用算法的准确性。以下是一些常见的数据归一化技术:
1. 标准化(Standardization) :假设数据符合标准正态分布,通过对每个数据点减去均值并除以标准差,使数据转换为均值为 0、标准差为 1 的标准正态分布。在 Sklearn 中可使用以下代码实现:
from sklearn.preprocessing import StandardScaler
- 归一化(Normalization) :这是一种线性缩放技术,将数据集 $X$ 中的元素缩放到 0 到 1 的范围。计算公式为 $X_i = (X_i – Min_x)/[Max_x – Min_x]$,其中 $Min_x$ 是 $X_i$ 的最小值,$Max_x$ 是 $X_i$ 的最大值。Sklearn 中对应的类为:
from sklearn.preprocessing import Normalizer
- 最小 - 最大缩放(Min - Max Scaling)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



