记录“归一化”方法

最新推荐文章于 2024-10-18 19:26:54 发布

原创最新推荐文章于 2024-10-18 19:26:54 发布 · 320 阅读

2 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

8 篇文章

订阅专栏

归一化（标准化）：Z-score标准化方法；min-max标准化

更为复杂的方法为【重新缩放法】，出自：http://www.nohup.cc/article/166/#menu_index_2

【Z-score标准化方法】

标准化方法有一个好处：python里面的numpy包中有求矩阵均值，标准差等统计参数的函数，很方便。

其中， $x$ , $\bar{x}$ , $\sigma$ , $x{}'$ 分别表示原矩阵中需要归一化的输入数据，原矩阵数据的均值，原矩阵数据的标准差，归一化后的输出数据。

在python中利用 numpy，实现。

假设，样本含有n个因素，共有m个样本，即可以组成 m*n，矩阵。

归一化如下：

def Normalization(self):
        self.martix = open_the_file()  #打开数据文件函数
        u = np.mean(self.martix, axis=0) # axis=0，计算每一列的均值
        v = np.std(self.martix, axis=0) # axis=0计算每一列的标准差
        for j  in range(self.M):
            for i  in range(self.N):
                self.martix[j][i] = (self.martix[j][i] - u[i]) / v[i]

【min-max标准化】

$x{}'=\frac{x-min(x)}{max(x)-min(x)}$

mix(x)为此列的最小值，max(x)为此列的最大值， $x{}'$ 归一化后的值。

import numpy as np

a = np.loadtxt(r'C:\Users\happy\test1.txt') #3*7的数组
max_martix = a.max(0) #0代表按照列比较；1代表按行比较
min_martix = a.min(0)
deff_value = max_martix - min_martix
for i  in range(0,2): 
    for j  in range(0,7):
        a[i][j] = (a[i][j] - min_martix[j]) / deff_value[j]