特征工程之特征缩放：行归一化（范数化，Normalizer）python

最新推荐文章于 2023-06-21 01:07:33 发布

追逐程序梦想者

最新推荐文章于 2023-06-21 01:07:33 发布

阅读量851

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 机器学习 sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ai52learn/article/details/130513726

Python基础及其应用专栏收录该内容

605 篇文章 ¥59.90 ¥99.00

订阅专栏

特征缩放是机器学习数据预处理的重要步骤，行归一化（范数化）确保样本特征向量的欧几里得距离为1，使模型更具鲁棒性。本文通过sklearn.preprocessing库的Normalizer类展示了如何在Python中进行行归一化，适用于线性模型和神经网络的数据预处理。

特征工程之特征缩放：行归一化（范数化，Normalizer）python

在机器学习中，数据预处理通常包括特征工程，而特征工程的目的就是将原始数据转化为更具有表征性的特征。特征缩放是特征工程中最重要的步骤之一，因为不同的特征通常具有不同的尺度和分布，而特征缩放可以帮助我们将数据调整为一个更统一的尺度和范围，从而更好地适应模型。

本文将介绍特征缩放中的一种方法——行归一化（范数化），并用Python代码演示其实现过程。

1.行归一化

行归一化，也叫做范数化，是一种将每个样本的特征向量缩放到单位范数的方法，即调整每个样本的特征向量使得它们的欧几里得距离都为1，这样可以保证样本在各个特征方向上的比重是相同的。

实现行归一化可以使用sklearn.preprocessing库中的Normalizer类，其中可选的参数有norm和copy。norm参数指定了要使用的范数类型，可以选择l1、l2和max，默认值是l2；copy参数指定了是否复制原本的数据进行操作，True表示复制，False表示直接在原始数据上进行操作。

2.范例代码

下面的示例代码演示了如何使用Normalizer类进行行归一化，其中使用的数据是sklearn.datasets库中的digits数据集。

from sklearn.datasets import load_digits

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。