归一化和标准化关于是否改变原始数据分布的探讨
最近在做关于ECG的降噪实验,在数据处理过程中需要进行归一化的操作,因此对常见的标准化和归一化做一下总结。
归一化
归一化的目的
- 将数值变为(0,1)之间的小数
- 把有量纲的表达式变为无量纲的表达式
归一化的优点
- 提升模型的收敛速度
- 提升模型的精度
- 深度学习中数据归一化可以防止模型梯度爆炸
常见的数据归一化方法
- min-max归一化: x ′ = x − m i n ( x ) m a x ( x ) − m i n ( x ) x^{'}=\frac{x-min(x)}{max(x)-min(x)} x′=max(x)−min(x)x−min(x)
这种是对数据的数值范围进行特定缩放,但不改变其数据分布的一种线性特征变换
#min-max数据归一化
import numpy as np
import matplotlib.pyplot as plt
import numpy as np
import scipy.io as sio
import os
import seaborn as sns
#Seaborn是一种基于matplotlib的图形可视化python libraty。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
import matplotlib
font_set=