缺失数据处理的三种方法
以表table_missing为例
导入数据:
import pandas as pd
import numpy as np
df = pd.read_csv('data/table_missing.csv')
df.head()
表如下:
1. 方法一:填充,fillna方法
(a)值填充与前后向填充
df['Physics'].fillna('missing').head()##值填充
df['Physics'].fillna(method='ffill').head()##向前填充
df['Physics'].fillna(method='backfill').head() ##向后填充
(b)填充中的对齐特性
df_f = pd.DataFrame({
'A':[1,3,np.nan],'B':[2,4,np.nan]