
kylin
文章平均质量分 67
zhangxiaomei1952
统计、数据、python、spss,r
展开
-
Apache kylin原理
本文主要介绍了Apache Kylin是如何将Hive表中的数据转化为HBase的KV结构,并简单介绍了Kylin的SQL查询是如何转化为HBase的Scan操作。Apache Kylin 是什么Apache Kylin是一个开源的、基于Hadoop生态系统的OLAP查询引擎,能够通过SQL接口对十亿、甚至百亿行的超大数据集实现秒级的多维分析查询。OLAP 是什么即转载 2018-02-06 19:08:26 · 1480 阅读 · 0 评论 -
kylin cube segment合并
一、segment cube的计算是将每天的数据作为一个segment进行存储,一个segment对应hbase中的一张表。有多少个build任务就会有多少个segment,在hbase中就会有多少张表。二、查询 在指标平台进行报表查询时,选择了一个时间段,比如20170606-2070629,使用kylin进行查询时会扫描hbase中这段时间每转载 2018-02-06 19:00:11 · 4149 阅读 · 2 评论 -
kylin维度优化指南
先说一下维度表需要遵循的规范:维表需要有code和name,比如:city_code city_namecode字段的类型最好使用整数,这样可以加快kylin的构建速度和查询速度如果维表是层级维表,比如是国家、省份、城市的层级需要对每个层级都要有对应的code和name,比如:country_code country_name province_code province_name转载 2018-02-06 18:56:30 · 5414 阅读 · 0 评论 -
kylin使用过程中需要注意的点
一、维表事实表中多个维度字段不能关联同一张维表。如果关联同一张表的情况,可通过视图区别开。二、维表字段 不同维表中的字段不能同名,建议加上表名做前缀。字段的中文描述应区分开,比如city_name,根据字段的不同用途可分别命名为所在地城市、访问地城市。 对于时间维表,配置cube 时 选定的字段命名必须 统一:日 的叫 DATE 字段, 周是SUN_DT转载 2018-02-06 18:54:36 · 4080 阅读 · 1 评论 -
kylin报错及解决方案总结
一、在build cube这一步中报错:Value not exists!查询该步的mr日志,提示 Not a valid value:2017-05-31,有两种可能1.该错误是由于build过程中,所引用的维表数据发生了变化,使用该值查询维表,维表中不存在这条数据。2.olap表关联了维表,但只使用了关联字段,如果olap表的code在维表里不存在,则会报错转载 2018-02-06 18:46:45 · 14740 阅读 · 0 评论