import os
import pandas as pd
os.chdir(r"D:\pycharm程序文件\练习1")
data = pd.read_excel("data.xlsx")
print(data.shape)
print(data.shape[0])
print(data['被保险人年龄'].isnull())
print(data.info())
print(data[['风险类别(A最低,E最高)','被保险人年龄']].info())
print(data[['风险类别(A最低,E最高)']].info())
"""
(1)
找不到直接计算空值行数的方法
利用加减法计算缺失值个数及缺失率
1. 先用count()计算出行数(列非空值的行数); count(axis=1)是计算列数的. 默认axis=0
2. shape[0]计算出总行数
"""
missing_value = data['风险类别(A最低,E最高)'].shape[0] - data['风险类别(A最低,E最高)'].count()
missing_rate = missing_value/data['风险类别(A最低,E最高)'].shape[0]
print("missing_value = %d"%missing_value)
print('missing_rate = {}'.format(missing_rate))