tensorflow（1）---归一化

最新推荐文章于 2024-04-07 07:41:34 发布

原创最新推荐文章于 2024-04-07 07:41:34 发布 · 3.1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#1024程序员节 #tensorflow #人工智能 #python #深度学习

tensorflow快速入手专栏收录该内容

13 篇文章

订阅专栏

归一化是数据分析预处理的重要步骤，主要用于调整不同特征间数量级的差异。通过最大最小值、方差或均值等方法进行转换，确保数据在同一尺度上。线性回归等模型中，归一化有助于梯度下降更快收敛，减少优化时间。常见归一化方式包括最大最小值归一化、方差归一化和均值归一化，各有优缺点。归一化的主要好处是优化模型训练，提高解的质量。

（1）归一化是属于预处理阶段的操作

（2）归一化所在库sklearn.processing中

（3）归一化是对数据中x进行转化，y不动（x为原始数据，y为分类标签）

（4）归一化是把数据每列变换到差不多的数量级

（5）为什么归一化：

以线性回归y=w1*x1+w2*x2为例（不考虑偏置bias）,假设x1为年龄(10,20,30,40),x2为收入(10000,20000,30000,40000),此时数量级x2>>x1（远远大于）。y不变，数量级w1>>w2,在梯度下降求线性回归时，第一步初始化w的值不容易确定,并且对于损失函数来说

如图，损失函数椭圆中心点为最优解，在循环中,w2很容易便达到了预期点，并在周围徘徊等待其他维度，这样可能会使整体迭代时间很长。

（6）怎么归一化：

最大最小值归一化： $\frac{x_{ij}-min(x_{j})}{max(x_{j})-min(x_{j}))}$ ,xij为所有行所有列中最大的数据（全局最大），min(xj)为每一列最小值，max（xj）为每一列最大值

优点：一定可以缩放到0-1之间

缺点：只用了最大值和最小值来做归一化，如果最大值或最小值是异常值，会非常不均匀

方差归一化：每个值除以每一列的方差

优点：因为是用方差，而方差其实用了一列的所有数据来算出来的，所以可以减轻异常值的影响

缺点：不一定会把数据缩放到0到1之间

均值归一化：每一个值去减去所在一列的均值

目的：也是可以用于减小数量级的，更重要的目的是使得我们的数据有正有负

（7）总结归一化好处：

用了归一化，可以使我们的W调整的方向更趋近于沿着直线方向去走

用了归一化，可以使得我们找到更小损失，更好的局部最优解

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。