1.机器学习数据预处理-缺失值
在处理机器学习所需要的数据时,经常会遇到处理含有缺失值的数据,这种数据未经过预处理,常常存在缺失值、异常值情况,此篇文章仅仅介绍如何解决缺失值的问题。
2.拉格朗日插值法
我相信即使我在这里放了拉格朗日插值法的数学原理也是没有人看的,所以此处就简要的说明一下拉格朗日插值法的原理。
2.1原理
拉格朗日插值法的原理即,取缺失值所在位置的前后k个数放进拉格朗日多项式插值公式进行计算。(此处不懂什么是拉格朗日多项式插值公式的回去问你的大学高数老师)
2.2数据示例
此处我们使用如图所示的小数据进行说明:
2.3拉格朗日插值代码
以下代码默认取缺失值前后5个数进行计算,可直接运行。
step1:读取数据
# 拉格朗日插值法
import pandas as pd
import numpy as np
from scipy