十一、python-数据清洗:缺失值异常值重复值处理

1、快速浏览数据集

#导入数据
import pandas as pd
df=pd.read_excel("/Users/tinawang/Documents/python/case.xlsx",sheet_name="清洗")
df
   id     price     name
0   1  999999.0     豆角炒肉
1   2      10.0       米线
2   2      10.0       米线
3   3       NaN  西红柿鸡蛋盖饭
4   4      50.0      红烧鱼
5   5      45.0      排骨汤
6   6       5.0      土豆丝
#输出数据详情信息,可知price列有一个空值
print(df.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   id      7 non-null      int64  
 1   price   6 non-null      float64
 2   name    7 non-null      object 
dtypes: float64(1), int64(1), object(1)
memory usage: 296.0+ bytes
#获取前5行数据
print(df.head())
  id     price     name
0   1  999999.0     豆角炒肉
1   2      10.0       米线
2   2      10.0       米线
3   3       NaN  西红柿鸡蛋盖饭
4   4      50.0      红烧鱼
#获取前1行数据
print(df.he
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值