今天的在工作中遇到需要在接口调用记录表中统计数据, 初步实现使用存储过程. 发现查询次数过多且效率较低. 经过几个小时各种百度,谷歌得到以下成功(使用SQL语句优化存储过程查询次数), 其中仍有不足之处, 先记录下来, 后期优化;
表结构如下:
| 列名 | 中文名 |
| userTripId | 自增ID |
| eventTime | 记录时间, 数据格式 yyyy-MM-dd hh:mm:ss |
| h | 小时时间 |
| m | 分钟时间 |
| userId | 用户ID |
部分数据内容如下, 正常情况下数据量在35W左右:

查询语句:
SELECT
d.eventTime,
h,
d.m,
elt(
INTERVAL (d.m, 0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 59),
'0~5分钟',
'5~10分钟',
'10~15分钟',
'15~20分钟',
'20~25分钟',
'30~35分钟',
'35~40分钟',
'40~45分钟',
'45~50分钟',
'50~55分钟',
'55~59分钟'
) AS yb_level,
count(DISTINCT d.userId) AS cnt
FROM
t_utrip d
where
d.eventTime >= '2015-4-20'
and d.eventTime < '2015-4-21'
GROUP BY
h,
elt(
INTERVAL (d.m, 0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 59),
'0~5分钟',
'5~10分钟',
'10~15分钟',
'15~20分钟',
'20~25分钟',
'30~35分钟',
'35~40分钟',
'40~45分钟',
'45~50分钟',
'50~55分钟',
'55~59分钟'
)
ORDER BY
d.eventTime, d.h, d.m
SQL语句分析:
- 按小时(h列)分组
- 将按分钟区间分组, 通过INTERVAL(N, N1,N2,N3,...)函数将60分钟分割为: 0~4, 5~9, 10~14, 15~19, ... 55~59; 函数INTERVAL()将返回对应的下标值, 起始值为1(查看INTERVAL函数详情)
- 使用ELT(N, N1,N2,N3,...)函数将对应区间转换为指定值, 即: '0~5分钟', '5~10分钟', '10~15分钟', ... (查看ELT函数详情)
本文详细介绍了如何通过优化SQL语句和存储过程,提高接口调用记录表中统计数据查询的效率。通过合理利用INTERVAL和ELT函数,将时间区间进行细分并转换为易读的文本描述,从而减少了查询次数,显著提升了查询性能。重点分析了原始查询语句的改进之处,并提供了关键信息的解释。
1096

被折叠的 条评论
为什么被折叠?



