1.规范化
将数据进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。
1.最小-最大规范化
线性变换,将数值映射到【0,1】之间。
2.零-均值规范化
均值为0,标准差为1,标准正太分布,目前用到最多的方法
3.小数定标规范化
映射到【-1,1】之间
#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'E:/PythonMaterial/chapter4/demo/data/normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print data
data1=(data - data.min())/(data.max() - data.min()) #最小-最大规范化
print data1
data2=(data - data.mean())/data.std() #零-均值规范化
print data2
data3=data/10**np.ceil(np.log10(data.abs().max())) #小数定标规范化