数据处理:合并与连接操作全解析
1. 分层索引数据的均值计算
在数据处理中,有时我们需要对具有分层索引的数据进行均值计算。例如,有如下健康数据:
# 数据示例
# 这里假设 health_data 已经定义
data_mean = health_data.mean(level='year')
data_mean
输出结果如下:
| subject | Bob | | Guido | | Sue | |
| — | — | — | — | — | — | — |
| type | HR | Temp | HR | Temp | HR | Temp |
| year | | | | | | |
| 2013 | 37.5 | 38.2 | 41.0 | 35.85 | 32.0 | 36.95 |
| 2014 | 38.5 | 37.6 | 43.5 | 37.55 | 56.0 | 36.70 |
这里通过指定 level='year' ,我们计算了每年两次访问测量值的平均值。进一步,我们可以使用 axis 关键字对列级别进行均值计算:
data_mean.mean(axis=1, level='type')
输出结果:
| type | HR | Temp |
| — | — | — |
| year | |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



