数据分析之Python数据预处理

本文介绍了使用Python进行数据预处理的基本步骤,包括读取数据、数据表整理、数据查看、数据补充、空值及异常值处理、重复值检查、数据整合、列名重命名等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于Python基础,今天聊一下怎么对数据进行预处理。

(一)读入数据

        read_csv()

        read_excel()

(二)数据表整理

        reset_index() --> 自增序号

(三)数据查看

        head() --> 从开头数前几条数据,一般默认为5

        tail() --> 倒数几条数据,一般默认为5

        columns --> 列标题

        info --> 基础信息

        shape --> 行列值

        discribe() --> 基本描述

(四)数据补充

        df['new'] = ...

(五)空值、异常值处理

        isnull().dropna

(六)重复值

        any(df.duplicated())

(七)整合数据

        merge

(八)列名重命名

        rename

(九)数据表查看

        dtypes

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值