分组取每组前n条
数据分析分组展示N行想必大家都不陌生,clickhouse也很方便的提供了相关的查询语法:LIMIT n BY express,我们以系统表为例,用到的属性有数据库名、表名、表大小。
-- 数据库分组取每个库下最大的三个表
SELECT database,
table,
formatReadableSize(sum(data_compressed_bytes)) AS bytes
FROM system.parts
GROUP BY database,table
ORDER BY database,bytes DESC
limit 3 by database
┌─database───────────────┬─table──────────────────────────┬─bytes──────┐
│ default │ insert_test_76 │ 9.93 MiB │
│ default │ insert_test_77 │ 9.92 MiB │
│ default │ insert_test_67 │ 9.42 MiB │
│ system │ trace_log │ 8.31 MiB │
│ system │ metric_log │ 74.76 MiB │
│ tutorial │ hdfs2ch │ 5.32 MiB │
│ tutorial │ visits_v1 │ 310.43 MiB │
│ tutorial │ hits_v1 │ 1.18 Gi

本文深入讲解ClickHouse数据库的高级使用技巧,包括分组取每组前N条记录、分组汇总计算、表重命名、日期类型函数应用及字段的添加与修改等,帮助提升数据分析效率。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



