数仓建模
xiaowei0548
单身可撩啊喂
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
尚硅谷大数据项目之电商数仓(4即席查询数据仓库)
尚硅谷大数据项目之电商数仓(即席查询) (作者:尚硅谷大数据研发部) 版本:V4.0 第1章 Presto 1.1 Presto简介 1.1.1 Presto概念 1.1.2 Presto架构 1.1.3 Presto优缺点 1.1.4 Presto、Impala性能比较 https://blog.youkuaiyun.com/u012551524/article/details/79124532 测试结论:Impala性能稍领先于Presto,但是Presto在数据源支持上非常丰富,包括Hive、图数据库、传统关系型原创 2020-05-13 11:51:25 · 1996 阅读 · 0 评论 -
大数据技术之Sqoop
尚硅谷大数据技术之Sqoop (作者:尚硅谷大数据研发部) 版本:V2.0 第1章 Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。 Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为原创 2020-05-12 11:41:25 · 824 阅读 · 0 评论 -
模型设计
ESDK迁移: 需求:总共需迁移7张报表,1封海外邮件的数据(暂不迁移) 规划: 1、针对各个报表,抽离出其维度和指标 2、对维度和指标进行抽象 3、得到各个指标取数逻辑 4、模型表结构设计(用户模型,收益及成本模型) 5、ETL开发 6、配置模型(BI展示) 7、自测数据 8、调度开发 9、调度上线 10、业务验收 难点: 1、报表展示层的sql都是几百行,查询性能也不高。维护成本特高,解读起来...原创 2019-10-28 16:53:25 · 340 阅读 · 0 评论
分享