1、快速浏览数据集
#导入数据
import pandas as pd
df=pd.read_excel("/Users/tinawang/Documents/python/case.xlsx",sheet_name="清洗")
df
id price name
0 1 999999.0 豆角炒肉
1 2 10.0 米线
2 2 10.0 米线
3 3 NaN 西红柿鸡蛋盖饭
4 4 50.0 红烧鱼
5 5 45.0 排骨汤
6 6 5.0 土豆丝
#输出数据详情信息,可知price列有一个空值
print(df.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 id 7 non-null int64
1 price 6 non-null float64
2 name 7 non-null object
dtypes: float64(1), int64(1), object(1)
memory usage: 296.0+ bytes
#获取前5行数据
print(df.head())
id price name
0 1 999999.0 豆角炒肉
1 2 10.0 米线
2 2 10.0 米线
3 3 NaN 西红柿鸡蛋盖饭
4 4 50.0 红烧鱼
#获取前1行数据
print(df.he