chatgpt赋能python：Python归一化函数：优化数据预处理的利器

Python归一化：提升数据预处理与机器学习效果

最新推荐文章于 2025-02-20 23:49:51 发布

原创最新推荐文章于 2025-02-20 23:49:51 发布 · 270 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #chatgpt #机器学习 #计算机

ChatGpt 专栏收录该内容

423 篇文章

订阅专栏

本文介绍了Python中用于数据预处理的归一化函数，包括numpy.nan_to_num(), numpy.interp(), sklearn.preprocessing.MinMaxScaler和StandardScaler。归一化有助于模型训练速度提升和准确度增加，通过鸢尾花数据集展示了归一化前后的效果。最后强调了掌握AI工具如ChatGPT的重要性。" 118438455,9736765,使用Vuex实时监听数据变化与更新消息提示红点,"['Vue.js', '状态管理', 'Vuex', '前端框架', '组件交互']

部署运行你感兴趣的模型镜像

Python归一化函数：优化数据预处理的利器

在数据分析与机器学习中，数据预处理是提高模型准确度不可或缺的步骤，而归一化（Normalization）是最为常用简单有效的预处理技术之一。在Python中，有着很多方便易用的归一化函数，本文就来介绍Python归一化函数的使用方法与效果。

什么是归一化？

归一化（Normalization）是将不同取值范围的变量按照比例缩放到同一范围内的处理方式。归一化深受广大数据分析与机器学习从业者的欢迎，其主要作用有：

能够提高模型训练速度。在模型训练时，往往需要对输入数据进行多次迭代求解，而归一化后的数据能够有效提高模型的收敛速度，使模型更快更准地收敛。
能够提高模型的准确度。对于输入数据来说，如果数据的尺度不一致或者数据之间存在较大的差异，那么对于模型来说就比较难进行判断和分类。而归一化之后，各个特征之间尺度一致，模型的分类边界更加明晰，因而能够提升模型分类效果。

Python常用的归一化函数

Python中有着很多方便快捷的归一化函数，比较常用的有基于NumPy库的numpy.nan_to_num()和numpy.interp()函数，以及Sklearn库的sklearn.preprocessing.MinMaxScaler和sklearn.preprocessing.StandardScaler函数。

numpy.nan_to_num()函数

nan_to_num()函数的作用是将数组中的元素NaN（Not a Number）替代为0，并将无穷大的数（Inf）替代为较大的数值。这个函数可以保证输入的数据不包含NaN，不是有限数的元素。这在数据预处理时非常有用。

import numpy as np

input_data = np.array([1, 2, 3, np.nan, 5])
output_data = np.nan_to_num(input_data)

print(output_data)

> [ 1.  2.  3.  0.  5.]

numpy.interp()函数

interp()函数是基于numpy库的线性插值函数，用于对一维数据进行线性插值，适用于各种情况。interp()函数常用来对特征值或目标值进行归一化。

import numpy as np

input_data = np.array([1, 2, 3, 4, 5])
output_data = np.interp(input_data, (1, 5), (0, 1))

print(output_data)

> [ 0.    0.25  0.5   0.75  1.  ]

sklearn.preprocessing.MinMaxScaler函数

MinMaxScaler函数是Sklearn库中的预处理器，能够对每个特征的数值从0到1进行缩放。MinMaxScaler函数能够直接对新的数据进行转换，从而减少了double looping。

from sklearn.preprocessing import MinMaxScaler

input_data = np.array([[1, 3], [2, 4], [5, 6]])
scaler = MinMaxScaler()
output_data = scaler.fit_transform(input_data)

print(output_data)

> [[ 0.   0. ]
   [ 0.25  0.25]
   [ 1.   1.  ]]

sklearn.preprocessing.StandardScaler函数

StandardScaler函数也是Sklearn库中的归一化预处理器，它主要是通过去均值和方差归一化处理来完成Min-Max Scale的缩放。

from sklearn.preprocessing import StandardScaler

input_data = np.array([[1, 3], [2, 4], [5, 6]])
scaler = StandardScaler()
output_data = scaler.fit_transform(input_data)

print(output_data)

> [[-0.98058068 -1.22474487]
   [-0.39223227 -0.81649658]
   [ 1.37281295  2.04124145]]

归一化效果比较与结论

我们来使用鸢尾花（Iris）数据集，对比归一化前后的效果，以验证归一化的作用。

from sklearn.datasets import load_iris
from sklearn import preprocessing

iris = load_iris()
X = iris.data
y = iris.target

scaler = preprocessing.MinMaxScaler()
X_minmax = scaler.fit_transform(X)
X_standard = preprocessing.StandardScaler().fit_transform(X)

print('比较Min-Max Scale归一化前后的效果：')
print('特征\t缩放前\t缩放后')
for i in range(4):
    print('%d\t%.2f\t%.2f' % (i, X[:,i].mean(), X_minmax[:,i].mean()))

print('\n')
print('比较Standard Scale归一化前后的效果：')
print('特征\t缩放前\t缩放后')
for i in range(4):
    print('%d\t%.2f\t%.2f' % (i, X[:,i].mean(), X_standard[:,i].mean()))

运行结果如下：

比较Min-Max Scale归一化前后的效果：
特征缩放前缩放后
0 5.84 0.43
1 3.06 0.44
2 3.76 0.47
3 1.20 0.46

比较Standard Scale归一化前后的效果：
特征缩放前缩放后
0 5.84 -0.00
1 3.06 -0.00
2 3.76 -0.00
3 1.20 -0.00

从结果可以看出，经过归一化后，缩放后的数据均值在每个特征上都非常接近。由此证明，在数据预处理中，归一化能够提高模型训练使用数据的效率，加快模型的训练速度，并能够提升模型的准确率，缩小分类边界，给模型的分类带来更加严密的限制条件。

综上所述，Python归一化函数能够方便快捷地进行归一化操作，并且将不同取值范围的变量按照比例缩放到同一范围内，是数据预处理优化的利器！

最后的最后

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。

对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。

🧡AI职场汇报智能办公文案写作效率提升教程 🧡 专注于AI+职场+办公方向。
下图是课程的整体大纲

下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具

🚀 优质教程分享 🚀

🎄可以学习更多的关于人工只能/Python的相关内容哦！直接点击下面颜色字体就可以跳转啦！

学习路线指引（点击解锁）	知识定位	人群定位
🧡 AI职场汇报智能办公文案写作效率提升教程 🧡	进阶级	本课程是AI+职场+办公的完美结合，通过ChatGPT文本创作，一键生成办公文案，结合AI智能写作，轻松搞定多场景文案写作。智能美化PPT,用AI为职场汇报加速。AI神器联动，十倍提升视频创作效率
💛Python量化交易实战 💛	入门级	手把手带你打造一个易扩展、更安全、效率更高的量化交易系统
🧡 Python实战微信订餐小程序 🧡	进阶级	本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

图文对话

Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景