真不错,超强图解 Pandas 18 招!

本文深入解析Pandas库的实用操作,包括筛选数据、排序、分组计算、聚合、过滤、合并与重塑数据。通过实例展示了如何使用sort_values、groupby、mean、agg、pivot_table等函数,帮助读者掌握数据挖掘过程中的关键技巧。同时,文章末尾还提及了关于人工智能技术基础的书籍抽奖活动。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

100c1e441402fd738357b094e75189f8.png3f80513e30baff02b9b65d6176e78d04.png9f6c24c6556099133a06527487d16e56.png8d64632a90d60244d7dd680e5971c2d6.png
selecting a column

dogs['longevity']

c773fbca0b42ef25f67541fdd38f4dba.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

fc4f162c31a6008141ef36b7928a3148.pnge596402f65b3a9e0633803fa62e33747.png

grouping multiple columns

dogs.groupby(['type', 'size'])

e3f707b41f7f71d0e2981c1ab59911e1.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

d4c28106e184481cfdfd2a93c990e7a1.pngee48d8463c524ab0c46684537d842f06.png39b5bc318adfae7565f886695ec064dd.pngcd49b01a8c5b17892afe74b7ad57214f.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]

8653016c200187d696f01e3615cf3a18.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

b9bfcbfbee708ca557215eb4ff18495f.png

dropping columns

dogs.drop(columns=['type'])

7333931065dbc0ad1a450b941d6990b2.png

joining

ppl.join(dogs)

cb65ecb847f03552d0c41c5238b40920.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

23d0870a46996c4bd0d48fa159221e80.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

58decdebe889dd5832a73db2c3aebf07.png

melting

dogs.melt()

f171c815e1212a1cd56ac90e37628ef8.png

pivoting

dogs.pivot(index='size', columns='kids')

6aaad9177997e6a543875e7d97983dd4.png

stacking column index

dogs.stack()

0315175952b3e234898e486ae008b44a.png

unstacking row index

dogs.unstack()

dcf45de1f73d1691d24e7a2429dec34b.png

resetting index

dogs.reset_index()

b5c24df9992e19dac502f6728998bcf0.png

setting index

dogs.set_index('breed')

ffb408bae0cc2d49ca7404f4d250f52f.png

来源:https://pandastutor.com/index.html

最后的最后,抽2本北京大学版社的《人工智能技术基础》,
这本书针对人工智能主要的发展领域:应答机器人、图像识别、物体识别、语音识别、视频识别等层面都有原理的解释和应用的扩展,让读者能全方位开启对人工智能技术的认识。
这次抽奖方式简单粗暴,本文点赞&在看后,留言点赞排名第1和第5分别送一本,9月8日22:00开奖,祝大家好运~
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值