python pandas.pivot_table透视表函数

最新推荐文章于 2025-11-16 16:09:08 发布

原创最新推荐文章于 2025-11-16 16:09:08 发布 · 3.9k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据分析

本文详细介绍了Pandas库中的pivot_table函数，包括其参数解析、实例演示和实用技巧。从新建数据集开始，展示了如何使用pivot_table进行数据透视，如设置不同维度、聚合函数、处理缺失值、计算合计项等。此外，还探讨了自定义聚合函数和填充缺失值的方法，为数据操作提供了实用指南。

部署运行你感兴趣的模型镜像

一、官方文档

pandas.pivot_table

二、参数解析

DataFrame.pivot_table(
    #column to aggregate, optional（要计数的列）
    values=None, 
    
    #column, Grouper, array, or list of the previous（要分组的索引）
    index=None, 
   
    #column, Grouper, array, or list of the previous（要分组的列名）
    columns=None, 

    #function, list of functions, dict, default numpy.mean（透视的函数，默认平均值）
    aggfunc='mean', 

    #scalar, default None（标量，默认无）
    fill_value=None, 

    #bool, default False（合计）
    margins=False, 

    #bool, default True（是否删除缺失值）
    dropna=True, 

    #str, default 'All'（'合计'命名）
    margins_name='All',
)

三、案例解析

3.1 新建数据集

import pandas as pd
import numpy as np

df = pd.DataFrame({
    "A": ["foo", "foo", "foo", "foo", "foo","bar", "bar", "bar", "bar"],
    "B": ["one", "one", "one", "two", "two","one", "one", "two", "two"],
    "C": ["small", "large", "large", "small","small", "large", "small", "small","large"],
    "D": [1, 2, np.nan, 3, 3, 4, 5, 6, 7],
    "E": [2, 4, 5, 5, np.nan, 6, 8, 9, 9]
})

在这里插入图片描述

3.2 两种写法

# 一般写法
df.pivot_table(
    values=['D','E'],         # 计算的数值列选择D、E
    index=['A','C'],          # 维度选择A、C
    aggfunc=[min,max,np.mean] # 聚合函数
)

#另一种写法
pd.pivot_table(
    df,
    values=['D','E'],         # 计算的数值列选择D、E
    index=['A','C'],          # 维度选择A、C
    aggfunc=[min,max,np.mean] # 聚合函数
)

在这里插入图片描述

3.3 columns参数

pd.pivot_table(
    df,
    values=['D','E'],
    columns=['A'],
    aggfunc=[min,max,np.mean]
)

在这里插入图片描述

3.4 fill_value 缺失值填充

df.pivot_table(
    values=['D','E'],
    index=['A','B','C'],
    aggfunc=[min,max,np.mean,np.std],
    fill_value=9999, # 缺失值填充
)

在这里插入图片描述

3.5 margins 求合计

df.pivot_table(
    values=['D','E'],
    index=['A','B'],
    columns=['C'],
    margins=True,
    margins_name="合计" # 合计名称
)

在这里插入图片描述

3.6 dropna 删除缺失值

df.pivot_table(
    values=['D'],
    index=['A','B'],
    columns=['C'],
    dropna=True, # 删除缺失值
    aggfunc=np.min
)

在这里插入图片描述

3.7 aggfunc 聚合函数与自定义函数

采用字典方法
通过 lambda 方法可以传入自定义函数

df.pivot_table(
    values=['C', 'E'], 
    index=['A', 'B'],        
    aggfunc={
        'C': ["count","unique",lambda x:len(x.unique())],              
        'E': np.mean
    }
)

在这里插入图片描述

您可能感兴趣的与本文相关的镜像

Python3.11

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本