
数据仓库
文章平均质量分 90
KD_
这个作者很懒,什么都没留下…
展开
-
OLAP数据库:hash、sort、shuffle、agg、join的实现原理
文章目录hash内存hashexternal hashsort内存sortexternal sortshufflehash shufflesort shuffleaggregatehash aggregatesort aggregate分布式aggregatejoinnested loop joinhash joinsort merge join分布式join总结hashhash算法是指对于key计算出hash值,基于hash值识别相同key,从而进行归类、聚合等操作。内存hash类似于JAVA H原创 2022-04-17 22:52:17 · 1689 阅读 · 0 评论 -
数据立方体压缩-Dwarf
文章目录Dwarf简介前缀冗余和后缀冗余Dwarf的结构Dwarf实例Dwarf的性质Dwarf的构建CreateDwarfCube algorithmSuffix Coalescing AlgorithmDwarf查询Dwarf简介数据立方体物化为所有可能的分组属性组合执行一个或多个聚合函数的计算。立方体物化的固有困难是它的大小。所有可能的group-bys的数量随立方体的维数成指数增长,立...原创 2020-04-09 01:29:32 · 888 阅读 · 0 评论 -
OLAP和数据立方体
数据仓库原创 2020-04-07 00:18:19 · 2841 阅读 · 1 评论