datawhale组队学习——pandas基础下——时序数据

本文探讨了Pandas在处理时序数据时的一些关键问题,包括date_range的批量加帧操作、提高Timestamp精度、处理超出时间范围的数据点以及查找缺失日期的方法。此外,还提供了超市牛奶销售额时间序列数据的实践练习,涵盖从查找最大值的星期到计算滑窗统计等任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习资源链接时序数据

一、总览在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
时序相关

二、疑问

1.在这里插入图片描述
2.在这里插入图片描述
3.在这里插入图片描述

三、思考题

【问题一】 如何对date_range进行批量加帧操作或对某一时间段加大时间戳密度?
【问题二】 如何批量增加TimeStamp的精度?
【问题三】 对于超出处理时间的时间点,是否真的完全没有处理方法?
【问题四】 给定一组非连续的日期,怎么快速找出位于其最大日期和最小日期之间,且没有出现在该组日期中的日期?

四、练习题

因为不知道如何把这jupyter里的Python快速导入到Markdown里面,就直接截图了。

【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:

(a)销售额出现最大值的是星期几?(提示:利用dayofweek函数)
(b)计算除去春节、国庆、五一节假日的月度销售总额
(c)按季度计算周末(周六和周日)的销量总额
(d)从最后一天开始算起,跳过周六和周一,以5天为一个时间单位向前计算销售总和
(e)假设现在发现数据有误,所有同一周里的周一与周五的销售额记录颠倒了,请计算2018年中每月第一个周一的销售额(如果该周没有周一或周五的记录就保持不动)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

【练习二】 继续使用上一题的数据,请完成下列问题:

(a)以50天为窗口计算滑窗均值和滑窗最大值(min_periods设为1)
(b)现在有如下规则:若当天销售额超过向前5天的均值,则记为1,否则记为0,请给出2018年相应的计算结果
(c)将©中的“向前5天”改为“向前非周末5天”,请再次计算结果
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值