
olap
文章平均质量分 80
北 方~
这个作者很懒,什么都没留下…
展开
-
一些存储引擎的对比
Kylin 离线/准实时/实时OLAP,兼容一部分明细类的查询。 对于超大规模数据量olap(广告,曝光),目前没有对手。 hbase作为存储引擎,通过m/r, spark根据维度的笛卡尔积组合计算聚合的结果。 准实时/实时,3.0版本实时olap对标druid,未来极有可能超越。 因为主要存储计算结果数据,90%查询结果直接可以通过rowkey获取,查询效率极高(可达ms级别)。 维度和指标可以通过bitmap, hll, 数据字典存储,存储占用很小。 支持JDBC 页面用原创 2021-01-12 14:15:54 · 1073 阅读 · 2 评论 -
浅谈OLAP引擎Kylin
OLAP OLAP 联机分析处理,主要支持复杂的分析操作,侧重决策的支持,对大数据量比较友好。普遍的场景就是星状模型的数据表查询,并且支持上钻,下卷的一些功能。 目前OLAP有两个方向, 1:预计算的方式。直接把所有维度组合的查询都预计算好,直接拿结果数据。 2:直接查询数据明细方式,通过一些优化手段(内存计算,增加索引,数据字典等),直接操作的是原始的数据。 目前在用的OLAP的一些开源引擎,kylin, druid, presto,impala, es比较多。druid主要用于实时数据,ky原创 2020-12-28 20:02:13 · 836 阅读 · 0 评论