【Mark一下】46个常用 Pandas 方法速查表

本文总结了Pandas中46个常用的数据处理方法,包括数据创建、查看、切片、筛选、预处理、合并、分类汇总及高级函数使用等,旨在为数据分析人员提供一份实用的操作手册。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

python免费学习资料、代码以及群交流解答点击即可加入


导读:Pandas是日常数据分析师使用最多的分析和处理库之一,其中提供了大量方便实用的数据结构和方法。但在使用初期,很多人会不知道:

1.它能提供哪些功能?
2.我的需求应该用哪个方法?
3.具体某个方法怎么调用?

本篇文章总结了常用的46个Pandas数据工作方法,包括创建数据对象、查看数据信息、数据切片和切块、数据筛选和过滤、数据预处理操作、数据合并和匹配、数据分类汇总以及map、apply和agg高级函数的使用方法。

你可以粗略浏览本文,了解Pandas的常用功能;也可以保存下来,作为以后数据处理工作时的速查手册,没准哪天就会用上呢~

1.创建数据对象

Pandas最常用的数据对象是数据框(DataFrame)和Series。数据框与R中的DataFrame格式类似,都是一个二维数组。Series则是一个一维数组,类似于列表。数据框是Pandas中最常用的数据组织方式和对象。有关更多数据文件的读取将在第三章介绍,本节介绍从对象和文件创建数据框的方式,具体如表1所示:

 

表1 Pandas创建数据对象

表1 Pandas创建数据对象

2.查看数据信息

查看信息常用方法包括对总体概况、描述性统计信息、数据类型和数据样本的查看,具体如表2所示:

 

表2 Pandas常用查看数据信息方法汇总

表2 Pandas常用查看数据信息方法汇总

 

注意在上述查看方法中,除了info方法外,其他方法返回的对象都可以直接赋值给变量,然后基于变量对象做二次处理。例如可以从dtype的返回值中仅获取类型为bool的列。

3.数据切片和切块

数据切片和切块是使用不同的列或索引切分数据,实现从数据中获取特定子集的方式。常见的数据切片和切换的方式如表3所示:

 

表3 Pandas常用数据切分方法

表3 Pandas常用数据切分方法

 

提示如果选择特定索引的数据,直接写索引值即可。例如data2.loc[2,['col1','col2']]为选择第三行且列名为'col1'和'col2'的记录。

4.数据筛选和过滤

数据筛选和过滤是基于条件的数据选择,本章2.6.3提到的比较运算符都能用于数据的筛选和选择条件,不同的条件间的逻辑不能直接用and、or来实现且、或的逻辑,而是要用&和|实现。常用方法如表4所示:

 

表4 Pandas常用数据筛选和过滤方法

表4 Pandas常用数据筛选和过滤方法

5.数据预处理操作

Pandas的数据预处理基于整个数据框或Series实现,整个预处理工作包含众多项目,本节列出通过Pandas实现的场景功能。本节功能具体如表5所示:

 

表5 Pandas常用预处理方法

表5 Pandas常用预处理方法

6.数据合并和匹配

数据合并和匹配是将多个数据框做合并或匹配操作。具体实现如表6所示:

 

表6 Pandas常用数据合并和匹配方法

表6 Pandas常用数据合并和匹配方法

7.数据分类汇总

数据分类汇与Excel中的概念和功能类似。具体实现如表7所示:

 

表7 Pandas常用数据分类汇总方法

表7 Pandas常用数据分类汇总方法

8.高级函数使用

Pandas能直接实现数据框级别高级函数的应用,而不用写循环遍历每条记录甚至每个值后做计算,这种方式能极大提升计算效率,具体如表8所示:

 

表8 Pandas常用高级函数

表8 Pandas常用高级函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值