pandas常用的数据分析函数(一)

本文介绍了一种检查和处理数据集的方法,包括如何查看数据的基本信息、处理缺失数据等关键步骤。对于缺失数据,提供了两种处理方式:填充特定值或直接删除含有缺失值的记录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1)查看数据函数

当收集到某一csv文件数据时,常用的查看函数

	inspect_dataset(df_data)
 def inspect_dataset(df_data):
     """
            查看加载的数据基本信息
     """
    print '数据集基本信息:'
    print df_data.info()
    
    print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1])
    print '数据预览:'
    print df_data.head()

 此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化

(2)处理缺失数据函数

  当数据文件中有缺失数据时,用此函数处理Na数据:

def process_missing_data(df_data):
    """
            处理缺失数据
    """
    if df_data.isnull().values.any():
        # 存在缺失数据
        print '存在缺失数据!'
        df_data = df_data.fillna(0.)    # 填充nan
        # df_data = df_data.dropna()    # 过滤nan
    return df_data                     	#返回数据
    #return df_data.reset_index()     #此为返回重置索引
 此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,

 当需要直接过滤时时用df_data.dropna(),

 当需要填充为数值或字符串时用df_data.fillna(0.)

 当需要返回数据时用return df_data

 当需要返回其处理后数据的重置索引时,用reset_index()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值