【机器学习 - 3】:数据归一化(最值归一化、均值方差归一化)

文章介绍了数据归一化的重要性,特别是在机器学习中,如KNN算法,归一化可以避免不同尺度特征的影响。文章详细讲解了最值归一化和均值方差归一化的公式及应用,并通过Python的sklearn库展示了如何对鸢尾花数据集进行归一化处理,最后用KNN算法评估了归一化后的效果。

数据归一化的使用


为什么要使用数据归一化?
举个例子,例如我们要使用KNN算法来预测肿瘤为良性肿瘤或恶性肿瘤。以下是一些数据:

肿瘤大小(厘米) 发现时间(天) 肿瘤类型
样本1 1 200 良性肿瘤
样本2 5 100 恶性肿瘤
样本3 2 150 良性肿瘤

根据以上数据,画出散点图

import numpy as np
import matplotlib.pyplot as plt

# 训练集数据
X_train = np.array([
    [1, 200],
    [5, 100],
    [2, 150]
])
y_train = np.array([1,0,1]) # 1为良性,0为恶性

# 绘制散点图
plt.figure(dpi=100)
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文
plt.scatter(X_train[y_train==1, 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

街 三 仔

你的鼓励是我创作的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值