【Pandas学习】DataFrame数据框的统计计算方法

博客提及DataFrame的汇总计算和描述统计相关内容,在信息技术领域,DataFrame常用于数据处理与分析,这部分内容对数据处理工作有重要意义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

### 使用 Pandas DataFrame 按旬统计 为了实现按旬统计数据,可以采用时间序列数据作为基础。通过设置日期索引来利用 `pd.Grouper` 函数来分组并执行聚合操作。 #### 创建带有时间戳的数据集 首先构建一个具有时间范围的 DataFrame 来模拟实际场景下的日度观测值: ```python import pandas as pd import numpy as np # 设定随机种子以便结果可重复 np.random.seed(42) dates = pd.date_range('2023-01-01', periods=60, freq='D') data = {'value': np.random.rand(len(dates))} df = pd.DataFrame(data=data, index=dates) ``` #### 定义函数以获取每旬的第一天 定义辅助函数用于确定每个时间段所属的具体旬期起始位置: ```python def get_decade(date): day_of_month = date.day decade_start_day = ((day_of_month - 1) // 10 * 10) + 1 return date.replace(day=decade_start_day) ``` #### 应用自定义频率转换器 使用 `.groupby()` 结合上述定义好的映射逻辑来进行分组求或其他所需的操作: ```python result_df = df.groupby(get_decade).agg( total_value=('value', 'sum'), # 计算各旬内的总 mean_value=('value', 'mean') # 并计算均值作为额外指标 ) print(result_df) ``` 此代码片段会输出一个新的 DataFrame,在这里每一行代表原始数据集中对应期间内所有记录经过特定运算后的汇总信息[^1]。 对于更复杂的分析需求,还可以继续扩展这个框架,比如加入更多维度或者调整所使用的统计量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值