import pandas as pd
import numpy as np
x = pd.DataFrame([[2000,0.732,0.836,0.628,0.743], [2001,0.758,0.883,0.688,0.787], [2002,0.859,0.914,0.781,0.929],[2003,1.0125,1.0440,1.0237,0.9847],[2004,1.2356,1.1069,1.2833,1.2363],[2005,1.4013,1.2152,1.5405,1.3182]])
x=pd.read_excel(‘D:\date\winequality\winequality-red1.xlsx’)
x=df.iloc[:,1:].T
1、数据均值化处理
x_mean=x.mean(axis=1)
for i in range(x.index.size):
x.iloc[i,:] = x.iloc[i,:]/x_mean[i]
x.iloc[i,:] = x.iloc[i,:]/x_mean[i]
2、提取参考队列和比较队列
ck=x.iloc[0,:]
cp=x.iloc[1:,:]
比较队列与参考队列相减
t=pd.DataFrame()
for j in range(cp.index.siz

本文介绍了一种基于Python的数据处理方法,通过均值化处理、关联系数计算及排序来对比不同年份的数据变化。首先对数据进行归一化处理,接着计算各个样本与基准样本之间的差值,并进一步计算最大差和最小差。通过设定的系数计算出各比较队列与参考队列间的关联系数,并最终完成关联系数的排序。
最低0.47元/天 解锁文章
1282





