图解Pandas,这篇文章是真的强!

本文深入介绍了Pandas库在数据挖掘中的关键操作,包括利用`sort_values()`按值排序,`groupby()`进行分组,`agg()`执行聚合计算,以及筛选、过滤、删除列、连接、合并、透视表、重塑和索引管理等。通过实例展示了每一步骤,帮助数据分析者更好地理解和应用Pandas。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

来源:https://pandastutor.com/index.html

大家伙,我是小z,也可以叫我阿粥

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

9fcd5c2dd97515ca3a5d49f835934290.png

14c5fb25b83ecac1eb7f6e6fe34ad969.png

23747bd5cea2bac8337b7c5139bd53d9.png

01df037ea5d18f255479a6deead6cdff.png

selecting a column

dogs['longevity']

beda887fdcb39fc0fb1a04c592e28e7f.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

18b2107e36790c8c1def1d52bbdc9714.png

193815485916539cb3f487e5d185b6ce.png

grouping multiple columns

dogs.groupby(['type', 'size'])

c9797395841e017970f264ea218d1562.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

6bd3d52bd3658fc2777b073c67793543.png

34a634443dad37cc15e0c4f72bfb022c.png

03a2b5749b89de7bc664f11b98416b67.png

54d6a3fda5bdb1d1ff4b9ea2f642b720.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]

e9bf819dcf6e75a92d3caa2d685405f7.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

606ae052683c9ec8b2e69b5f4d2847f5.png

dropping columns

dogs.drop(columns=['type'])

9f8e0c7fb51a225ee6dfa077e11a92ef.png

joining

ppl.join(dogs)

d1fd9b1ce19b69d1a1f7d7509e6b1ec8.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

9a844f181a99b046607f9a61b640555d.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

12d27f8d963b42dcd896d911ba4bd12c.png

melting

dogs.melt()

39e1a082820771af434bf2eb55f1e6f0.png

pivoting

dogs.pivot(index='size', columns='kids')

13f50f215de2c31d67c10e12eef72de6.png

stacking column index

dogs.stack()

15c0218d7bb62ff21759069d67fd298b.png

unstacking row index

dogs.unstack()

1426be1eef848e81d3b6c6cd2202e68e.png

resetting index

dogs.reset_index()

04c98fd92d82b575b4cf757d393f16bc.png

setting index

dogs.set_index('breed')

910b8748f8655ae757f5bd20c3c99cf5.png

以上。

4c02aa0cabfea2ce6ecba348b375c82d.gif

●分析师如何正确的提建议?
●品牌知名度分析
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值