数据标准化（Normalization)常用的6种方法python实现

最新推荐文章于 2025-10-11 11:24:58 发布

原创

最新推荐文章于 2025-10-11 11:24:58 发布 · 6k 阅读

33 ·

CC 4.0 BY-SA版权

文章标签：

#数据挖掘 #数据分析 #python #numpy

import numpy as np
import math

class DataNorm:
    def __init__(self):
        self.arr = [1, 2, 3, 4, 5, 6, 7, 8, 9]
        self.x_max = max(self.arr)
        self.x_min = min(self.arr)
        self.x_mean = sum(self.arr) / len(self.arr)
        self.x_std = np.std(self.arr) #标准差
    
    #1. Min-Max标准化
    def Min_Max(self):
        arr_ = list()
        for x in self.arr:
            arr_.append(round((x - self.x_min) / (self.x_max - self.x_min), 4))
        print("经过Min_Max标准化后的数据为：\n{}".format(arr_))
    
    #2. Z-Score标准化，Standard Score,基于原始数据的均值和标准差。
    def Z_Score(self):
        arr_ = list()
        for x in self.arr:
            arr_.append(round(((x - self.x_mean) / self.x_std), 4))
        print("经过Z_Score标准化后的数据为：\n{}".format(arr_))
      
    #3. 小数定标标准化，通过移动小数点的位置来进行数据的标准化。小数点移动的位数取决于原始数据中的最大绝对值。
    def DecimalScaling(self):
        arr_ = list()
        j = 1
        x_max = max([abs(i) for i in self.arr])
        while x_max / 10