题目:初识pandas库与缺失数据的补全
- 打开数据(csv文件、excel文件)
- 查看数据(尺寸信息、查看列名等方法)
- 查看空值
- 众数、中位数填补空值
- 利用循环补全所有列的空值
数据的读取与查看
# 读取数据
import pandas as pd
# 使用pandas中的read_csv读取csv文件
data = pd.read_csv(r'data.csv')
# pandas读取excel文件先安装openpyel库
# 使用pandas中的read_excel读取excel文件
data2 = pd.read_excel("data.xlsx")
type(data) # 类
输出:
pandas.core.frame.DataFrame
注:
DataFrame类型:类似二维的、表格型的数据结构,类似excel表格和SQL数据库中的表
# 布尔矩阵显示缺失值,返回一个布尔矩阵,也是dataframe对象
# True表示对应位置的值缺失,False表示对应位置的值存在
data.isnull()
输出:
| Id | Home Ownership | Annual Income | Years in current job | Tax Liens | Number of Open Accounts | Years of Credit History | Maximum Open Credit | Number of Credit Problems | Months since last delinquent | Bankruptcies | Purpose | Term | Current Loan Amount | Current Credit Balance | Monthly Debt | Credit Score | Credit Default | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | False | False | False | True | False | False | False | False | False | True | False | False | False | False | False | False | False | False |
| 1 | False | False | False | False | False | False | False | False | False | True | False | False | False | False | False | False | False | False |
| 2 | False | False | False | False | False | False | False | False | False | True | False | False | False | False | False | False | False | False |
| 3 | False | False | False | False | False | False | False | False | False | True | False | False | False | False | False | False | False | False |
| 4 | False | False | False | False | False | False | False | False | False | True | False | False | False | False | False | False | False | False |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | .. |

最低0.47元/天 解锁文章
175





