python pandas.pivot_table透视表函数

本文详细介绍了Pandas库中的pivot_table函数,包括其参数解析、实例演示和实用技巧。从新建数据集开始,展示了如何使用pivot_table进行数据透视,如设置不同维度、聚合函数、处理缺失值、计算合计项等。此外,还探讨了自定义聚合函数和填充缺失值的方法,为数据操作提供了实用指南。
部署运行你感兴趣的模型镜像

一、官方文档

pandas.pivot_table

二、参数解析

DataFrame.pivot_table(
    #column to aggregate, optional(要计数的列)
    values=None, 
    
    #column, Grouper, array, or list of the previous(要分组的索引)
    index=None, 
   
    #column, Grouper, array, or list of the previous(要分组的列名)
    columns=None, 

    #function, list of functions, dict, default numpy.mean(透视的函数,默认平均值)
    aggfunc='mean', 

    #scalar, default None(标量,默认无)
    fill_value=None, 

    #bool, default False(合计)
    margins=False, 

    #bool, default True(是否删除缺失值)
    dropna=True, 

    #str, default 'All'('合计'命名)
    margins_name='All',
)

三、案例解析

3.1 新建数据集

import pandas as pd
import numpy as np

df = pd.DataFrame({
    "A": ["foo", "foo", "foo", "foo", "foo","bar", "bar", "bar", "bar"],
    "B": ["one", "one", "one", "two", "two","one", "one", "two", "two"],
    "C": ["small", "large", "large", "small","small", "large", "small", "small","large"],
    "D": [1, 2, np.nan, 3, 3, 4, 5, 6, 7],
    "E": [2, 4, 5, 5, np.nan, 6, 8, 9, 9]
})

在这里插入图片描述

3.2 两种写法

# 一般写法
df.pivot_table(
    values=['D','E'],         # 计算的数值列选择D、E
    index=['A','C'],          # 维度选择A、C
    aggfunc=[min,max,np.mean] # 聚合函数
)

#另一种写法
pd.pivot_table(
    df,
    values=['D','E'],         # 计算的数值列选择D、E
    index=['A','C'],          # 维度选择A、C
    aggfunc=[min,max,np.mean] # 聚合函数
)

在这里插入图片描述

3.3 columns参数

pd.pivot_table(
    df,
    values=['D','E'],
    columns=['A'],
    aggfunc=[min,max,np.mean]
)

在这里插入图片描述

3.4 fill_value 缺失值填充

df.pivot_table(
    values=['D','E'],
    index=['A','B','C'],
    aggfunc=[min,max,np.mean,np.std],
    fill_value=9999, # 缺失值填充
)

在这里插入图片描述

3.5 margins 求合计

df.pivot_table(
    values=['D','E'],
    index=['A','B'],
    columns=['C'],
    margins=True,
    margins_name="合计" # 合计名称
)

在这里插入图片描述

3.6 dropna 删除缺失值

df.pivot_table(
    values=['D'],
    index=['A','B'],
    columns=['C'],
    dropna=True, # 删除缺失值
    aggfunc=np.min
)

在这里插入图片描述

3.7 aggfunc 聚合函数与自定义函数

  • 采用字典方法
  • 通过 lambda 方法可以传入自定义函数
df.pivot_table(
    values=['C', 'E'], 
    index=['A', 'B'],        
    aggfunc={
        'C': ["count","unique",lambda x:len(x.unique())],              
        'E': np.mean
    }
)

在这里插入图片描述

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值