import pandas as pd
from scipy.interpolate import lagrange
inputfile = r'missing_data.xls'
outputfile = r'new.xlsx'
df = pd.read_excel(inputfile, header=None)
print(len(df))
print(len(df.columns))
def ployinterp_column(s, n, k=5):
y = s.reindex(list(range(n-k, n)) + list(range(n+1, n+1+k)))
y = y[y.notnull()]
return lagrange(y.index, list(y))(n)
for i in range(len(df.columns)):
for j in range(len(df)):
if (df[i].isnull())[j]:
df[i][j] = ployinterp_column(df[i], j)
df.to_excel(outputfile, header=None, index=False)
python 拉格朗日插值法
最新推荐文章于 2024-07-06 16:48:32 发布
本文介绍了一种使用Python处理Excel文件中缺失数据的方法。通过读取Excel文件并利用拉格朗日插值法填补缺失值,该方法适用于各种大小的数据集。文章详细展示了如何遍历数据框中的每一列和每一行,当遇到缺失值时应用插值算法进行填充。
564

被折叠的 条评论
为什么被折叠?



