DAY 4 缺失值的处理

Python处理数据缺失值方法

原创

已于 2025-05-19 21:29:30 修改 · 1.1k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#python #jupyter

于 2025-05-19 20:28:40 首次发布

题目：初识pandas库与缺失数据的补全

打开数据（csv文件、excel文件）
查看数据（尺寸信息、查看列名等方法）
查看空值
众数、中位数填补空值
利用循环补全所有列的空值

数据的读取与查看

# 读取数据
import pandas as pd
# 使用pandas中的read_csv读取csv文件
data = pd.read_csv(r'data.csv')

# pandas读取excel文件先安装openpyel库
# 使用pandas中的read_excel读取excel文件
data2 = pd.read_excel("data.xlsx")

type(data) # 类

输出：

pandas.core.frame.DataFrame

注：

DataFrame类型：类似二维的、表格型的数据结构，类似excel表格和SQL数据库中的表

# 布尔矩阵显示缺失值，返回一个布尔矩阵，也是dataframe对象
# True表示对应位置的值缺失，False表示对应位置的值存在
data.isnull()

输出：

Id	Home Ownership	Annual Income	Years in current job	Tax Liens	Number of Open Accounts	Years of Credit History	Maximum Open Credit	Number of Credit Problems	Months since last delinquent	Bankruptcies	Purpose	Term	Current Loan Amount	Current Credit Balance	Monthly Debt	Credit Score	Credit Default
0	False	False	False	True	False	False	False	False	False	True	False	False	False	False	False	False	False	False
1	False	False	False	False	False	False	False	False	False	True	False	False	False	False	False	False	False	False
2	False	False	False	False	False	False	False	False	False	True	False	False	False	False	False	False	False	False
3	False	False	False	False	False	False	False	False	False	True	False	False	False	False	False	False	False	False
4	False	False	False	False	False	False	False	False	False	True	False	False	False	False	False	False	False	False
...	...	...	...	...	...	...	...	...	...	...	...	..