像写SQL一样学习pandas 中 DataFrame

本文深入探讨了Python pandas库中的DataFrame数据类型,通过实例展示了如何进行列筛选、数据索引、过滤、聚合和多表关联操作,并与SQL进行了对比,帮助读者更好地理解和应用DataFrame。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

当下python在数据处理以及量化分析数据挖掘上使用越发广泛,本文将针对pythonpandas包下的DataFrame这种数据类型的的使用进行详细说明,以及其在数据处理的同等情况下SQL中的对比,话不多说,开整!!!

 

关键字:pandasDataFrameSQL

 

 

 

1、关于数据表列的筛选

DataFrame(也就是二维数据表)data

使用

data=DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c'])

语句即可生成该DataFrame

 

data :

   a  b  c

0  0  1  2

1  3  4  5

2  6  7  8

 

如果我们只取dataa列 直接使用一个切片操作(注:对列进行选取切片操作是两层中括号):

data[['a']]
--------->

0    0

1    3

2    6

 

 

对应的SQL语句为:

select a from data

 

如果我们要取ab两个字段同样是切片操作:


data[['a','b']]
------>

   a  b

0  0  1

1  3  4

2  6  7

 

对应的SQL语句为:

select a,b from data

 

 

 

 

 

 

首先我们在此先创建两个DataFrame

公司基本信息数据表

companydata=DataFrame({'ID':['aa','bb','cc'],

                    'name':['公司A','公司B','公司C&
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值