机器学习入门-数据预处理(如何处理数据缺失值)

1.机器学习数据预处理-缺失值

在处理机器学习所需要的数据时,经常会遇到处理含有缺失值的数据,这种数据未经过预处理,常常存在缺失值、异常值情况,此篇文章仅仅介绍如何解决缺失值的问题。

2.拉格朗日插值法

我相信即使我在这里放了拉格朗日插值法的数学原理也是没有人看的,所以此处就简要的说明一下拉格朗日插值法的原理。

2.1原理

拉格朗日插值法的原理即,取缺失值所在位置的前后k个数放进拉格朗日多项式插值公式进行计算。(此处不懂什么是拉格朗日多项式插值公式的回去问你的大学高数老师)

2.2数据示例

此处我们使用如图所示的小数据进行说明:
在这里插入图片描述

2.3拉格朗日插值代码

以下代码默认取缺失值前后5个数进行计算,可直接运行。

step1:读取数据

# 拉格朗日插值法
import pandas as pd
import numpy as np
from scipy
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值