import numpy as np
import pandas as pd
df = pd.DataFrame(pd.read_excel('data01.xlsx'))
print(df)
#维度查看
df.shape
print('--------')
#数据表基本信息(维度、列名称、数据格式、所占空间、非空记录)
df.info()
#每一列数据的格式
df.dtypes
#某一列格式
df['productA'].dtype
#查看某一列空值
df.isnull()
#查看某一列唯一值
df['productA'].unique()
#查看数据表的值
print(df.values,type(df.values))
#查看列名称
df.columns
#查看前五行
df.head()
#查看后五行
df.tail()
#填充空值
df.fillna(99)#用99来填充空值
print(df)
#'productA'列 用 'productA'的均值填充
df['productA'].fillna(df['productA'].mean())
#df中的空值 用'productA'的均值填充
df.fillna(df['productA'].mean())
df2 = pd.DataFrame(pd.read_csv('book_info_all.csv',header=0))
df2.info()
print(df2.head())
df2.dtypes
#修改price 去除符号¥ ,并把数据转换成float 不能用replace ,replace 只能整值替换
df2['PRICE'].replace('¥','.',inplace = True)