使用Pandas的resample函数处理时间序列数据

在数据处理时,需要将某一天的数据按照小时聚合。例如聚合当天8点内的数据,并取平均值获得求和等。可以使用Pandas resample()函数对时间序列数据进行重采样。

df_sales.resample('2H').sum()#将数据集中的数据按2小时求和

注意,这里需要时间(time)那一列为索引,如果时间那一列不是索引的话会报错。

将time那一列设置为索引的代码:

df_sales=df_sales.set_index('time')

#获取指定时间段内的数据
drange = pd.date_range('2016-08-01 00:00:00', '2016-09-01 00:00:00',
                       freq='10min')
#这个只能获取到时间序列信息,不能获取到这一行其他列的信息。例如00:00:00的信息为3,使用这行代
码获得不了3这个数据

更多操作见原文章

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值