DAY 4 缺失值的处理

题目:初识pandas库与缺失数据的补全
  1. 打开数据(csv文件、excel文件)
  2. 查看数据(尺寸信息、查看列名等方法)
  3. 查看空值
  4. 众数、中位数填补空值
  5. 利用循环补全所有列的空值

数据的读取与查看

# 读取数据
import pandas as pd
# 使用pandas中的read_csv读取csv文件
data = pd.read_csv(r'data.csv')

# pandas读取excel文件先安装openpyel库
# 使用pandas中的read_excel读取excel文件
data2 = pd.read_excel("data.xlsx")
type(data) # 类

输出:

pandas.core.frame.DataFrame

注:

DataFrame类型:类似二维的、表格型的数据结构,类似excel表格和SQL数据库中的表

# 布尔矩阵显示缺失值,返回一个布尔矩阵,也是dataframe对象
# True表示对应位置的值缺失,False表示对应位置的值存在
data.isnull()

输出:

Id Home Ownership Annual Income Years in current job Tax Liens Number of Open Accounts Years of Credit History Maximum Open Credit Number of Credit Problems Months since last delinquent Bankruptcies Purpose Term Current Loan Amount Current Credit Balance Monthly Debt Credit Score Credit Default
0 False False False True False False False False False True False False False False False False False False
1 False False False False False False False False False True False False False False False False False False
2 False False False False False False False False False True False False False False False False False False
3 False False False False False False False False False True False False False False False False False False
4 False False False False False False False False False True False False False False False False False False
... ... ... ... ... ... ... ... ... ... ... ... ..
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值