使用sklearn进行数据标准化

H_uer

于 2019-09-24 20:51:35 发布

阅读量806

点赞数

分类专栏：深度学习使用python进行的语音读取

原文链接：https://blog.youkuaiyun.com/dengdengma520/article/details/79629186

版权

深度学习同时被 2 个专栏收录

16 篇文章

订阅专栏

使用python进行的语音读取

6 篇文章

订阅专栏

本文详细介绍了如何使用sklearn库中的preprocessing模块进行数据标准化处理，包括去除数据集的均值并将其方差缩放至1的过程。通过具体示例展示了如何应用scale函数和StandardScaler类实现数据预处理，后者更适用于需要保持训练集参数以便后续应用到测试集的场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

标准化（Z-Score），或者去除均值和方差缩放

公式为：(X-mean)/std 计算时对每个属性/每列分别进行。

将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1。

使用sklearn.preprocessing.scale()函数，可以直接将给定数据进行标准化。

>>> from sklearn import preprocessing

>>> import numpy as np

>>> X = np.array([[ 1 ., - 1 ., 2 .],

... [ 2 ., 0 ., 0 .],

... [ 0 ., 1 ., - 1 .]])

>>> X_scaled = preprocessing.scale(X)

>>> X_scaled

array([[ 0 . ..., - 1.22 ..., 1.33 ...],

[ 1.22 ..., 0 . ..., - 0.26 ...],

[- 1.22 ..., 1.22 ..., - 1.06 ...]])

>>>#处理后数据的均值和方差

>>> X_scaled.mean(axis= 0 )

array([ 0 ., 0 ., 0 .])

>>> X_scaled.std(axis= 0 )

array([ 1 ., 1 ., 1 .])

使用sklearn.preprocessing.StandardScaler类，使用该类的好处在于可以保存训练集中的参数（均值、方差）直接使用其对象转换测试集数据。

>>> scaler = preprocessing.StandardScaler().fit(X)

>>> scaler

StandardScaler(copy = True , with_mean = True , with_std = True )

>>> scaler.mean_

array([ 1. ..., 0. ..., 0.33 ...])

>>> scaler.std_

array([ 0.81 ..., 0.81 ..., 1.24 ...])

>>> scaler.transform(X)

array([[ 0. ..., - 1.22 ..., 1.33 ...],

[ 1.22 ..., 0. ..., - 0.26 ...],

[ - 1.22 ..., 1.22 ..., - 1.06 ...]])

>>> #可以直接使用训练集对测试集数据进行转换

>>> scaler.transform([[ - 1. , 1. , 0. ]])

array([[ - 2.44 ..., 1.22 ..., - 0.26 ...]])

博客等级

码龄8年

0
原创

41
点赞

252
收藏

16
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 归一化

下一篇：: numpy堆叠问题

最新评论

特征融合
jllllle: 讲的很好，差点让评论区那个看不懂的带了节奏
特征融合
好啊啊啊啊: 博主你文中所说的FPN的检测结果是指predict吗？但是我觉得FPN的核心不是在特征的层层传递上吗？中间做predict只是为了可视化？我们只需要最后的输出啊依照博主的意思是要把所有的predict都加起来？这样低层的语义信息加进去不是会使output更模糊吗？期待博主解答
语音信号处理共振峰
熬手: 作者写的很清楚
STFT和声谱图，梅尔频谱（Mel Bank Features）与梅尔倒谱（MFCCs）
m0_46953566: 您好，请问等面积梅尔滤波器门限值的介绍是那篇文献呢？我找了半天没找到啊
特征融合
一路低首不见云: 看不懂

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。