时序数据处理小技巧---巧用时间戳

本文介绍了在数据处理和特征工程中如何巧妙运用时间戳来高效地处理时序数据,提供两种示例,包括如何按15秒间隔统计用户下单次数以及获取输入时间前一周的数据。通过时间戳的运算,可以灵活地对时间进行划分和统计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

时序数据处理小技巧—巧用时间戳

数据处理和特征工程中中常常会遇到对时序数据的聚合统计等操作,我在未发现这个技巧之前,常常需要查各类时间处理的函数的api。但当有一次,有个朋友问我如何每间隔15秒(比较极端)统计多个不同账号的下单次数时,我发现使用现有函数去对划分时间很困难。这时我想到了时间戳去解决这个需求

示例一

某个流水表前十条数据
上图为某个流水表的部分数据,_id代表了一个用户,_time是下单时间,如何每隔15秒统计一次用户的下单次数呢?
以往做的都是按月,按天统计时,可以把时间戳转换成datetime,调函数去获得对应时间的进行统计。然而只要理解了时间戳就是格林威治时间到现在经过的秒或毫秒,那么我们就只需要一句代码就可以对这部分数据进行处理了
df['new_time'] = df._time.apply(lambda x:x//15000*15000)
在这里插入图片描述
如上图所示,new_time将数据按每隔15秒进行了一个切分(15秒=15000毫秒)。然后我们对相应地数据进行聚合统计就可以了。因为这里是多个用户的下单,正常我们需要按_id聚合后再按new_time进行聚合,这里在提另一个小技巧:字符串的拼接。
在这里插入图片描述
如上图所示,我们只需要对新拼接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值