数据处理与分析:Pandas 的强大功能
在数据处理和分析领域,Pandas 是一个非常强大的工具。它提供了丰富的功能,包括多维聚合、数据透视表操作以及矢量化字符串操作等。下面我们将详细介绍这些功能,并通过具体的例子来展示它们的应用。
1. 数据透视表(Pivot Table)
数据透视表是一种强大的数据汇总工具,它可以帮助我们从多个维度分析数据。
1.1 基本数据透视表操作
首先,我们来看一个关于泰坦尼克号乘客生存情况的例子。我们可以通过分组和聚合操作来分析性别和舱位对生存的影响:
titanic.groupby(['sex', 'class'])['survived'].aggregate('mean').unstack()
输出结果如下:
class First Second Third
sex
female 0.968085 0.921053 0.500000
male 0.368852 0.157407 0.135447
这个结果显示,女性和高等级舱位的乘客生存几率更高。不过,上述代码看起来有些冗长。Pandas 提供了 pivot_table
方法来简化这种多维聚合操作:
titanic.pivot_table('survived', index='sex', columns='class')