数据聚合、交叉制表与时间序列分析
一、数据聚合与交叉制表
1.1 数据聚合
在数据处理中, pivot_table 是一个强大的工具,它可以对数据进行聚合操作。以下是 pivot_table 的相关参数:
| 函数名 | 描述 |
| ---- | ---- |
| values | 要聚合的列名,默认聚合所有数值列 |
| rows | 用于在结果透视表的行上进行分组的列名或其他分组键 |
| cols | 用于在结果透视表的列上进行分组的列名或其他分组键 |
| aggfunc | 聚合函数或函数列表,默认为 ‘mean’,可以是任何在 groupby 上下文中有效的函数 |
| fill_value | 替换结果表中的缺失值 |
| margins | 添加行/列小计和总计,默认为 False |
1.2 交叉制表(Crosstab)
交叉制表是一种特殊的透视表,用于计算分组频率。以下是一个示例:
import pandas as pd
data = {
'Sample': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'Gender': ['Female', 'Male', 'Female', 'Male', 'Male', 'Male', 'Female', 'Female', 'Male', 'Female'],
'Handedness': ['Right-handed', 'Left-han
超级会员免费看
订阅专栏 解锁全文

891

被折叠的 条评论
为什么被折叠?



