前言
在数据分析过程中,我们常常需要将某个时间四舍五入到指定时间间隔的起始时间,如给定的时间为’2024-03-26 14:25:59’,但是我们想以30分钟为间隔分组统计数据,那么就希望’2024-03-26 14:25:59’变成’2024-03-26 14:00:00’。下面提供了python和sql的实现过程。
一、python实现过程
import pandas as pd
# 示例数据
data = pd.DataFrame({'ftime': ['2024-03-26 07:00:00', '2024-03-26 07:15:00', '2024-03-26 07:29:59', '2024-03-26 07:50:00'],
'value': [1, 2, 3, 4]})
def get_interval_window(dts, interval=30):
"""传入一个时间返回特定间隔的开始时间
如每30分钟为间隔 则传入2023-10-10 12:10:12 返回2023-10-10 12:00:00
:param dts: 时间格式的值
:param interval: 以几分钟为间隔 取值在0-60之间
demo: data['a'] = pd.to_datetime(data['a'], format='') 可以加format参数
data['b'] = data['a'].apply(lambda x: get_interval_window(x,interval=5))"""
dt1 = dts.replace(minute=(dts.minute // interval) * interval).replace(second=0).replace(microsecond=0)
return dt1
data['ftime'] = pd.to_datetime(data['ftime'])
data['interval'] = data['ftime'].apply(lambda x: get_interval_window(x))
data
输出结果如下,
二、SQL实现过程
1.clickhouse
clickhouse中主要用到toStartOfInterval函数
-- toStartOfInterval(column, interval 1 hour)
-- column: 时间列列名
-- interval: 时间间隔 interval 1 hour: 间隔1个小时 interval 30 minute: 间隔30分钟
select toStartOfInterval(ftime, interval 30 minute) as interval
from table_name
-- 如果不想在clickhouse中建立示例数据去试验该函数,可以像下面这样,传入一个具体的时间值
select toStartOfInterval(toDateTime('2024-02-10 12:13:49'), interval 30 minute) as interval
2.postgresql
postgresql中没有直接的函数,需间接求得
-- postgresql中实现toStartOfInterval功能
-- 以每30分钟为间隔举例
-- 首先使用date_trunc函数, 只截取时间到小时 如'2024-12-12 12:35:31'将被截取到'2024-12-12 12:00:00'
select date_trunc('hour', timestamp '2024-12-12 12:35:31')
-- 输出: 2024-12-12 12:00:00
-- 然后计算原本时间的分钟数中包含多少个30分钟, 则要使用extract函数, 提取出分钟数
select extract(minute from timestamp '2024-12-12 12:35:31')
-- 输出: 35
-- 计算提取出的分钟数整除30分钟的商 floor是向下取整的函数
select floor(extract(minute from timestamp '2024-12-12 12:35:31') / 30)
-- 输出: 1 说明35分钟包含1个30分钟,则接下来只需要在date_trunc的基础上 加上1 * 30分钟即可
**自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。**
**深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!**
**因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。**






**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!**
**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**
**如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)**
真正体系化!**
**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**
**如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)**
