Hadoop 之上的数据建模 - Data Vault 2.0
对比传统的基于 RDBMS 之上的数据仓库和商业智能项目,尝试着说说,Hadoop 之上的数据仓库,从ETL, 数据存储,到分析展现。重点围绕数据建模方面做分析,因为这是本文的重点,介绍一份新的数据建模方式 Data Vault 2.0.
ETL 最基本的构建来自于 转换和工作流。
工作流,作用是规划一条完整的数据转换流。
转换,是 ETL 最中心的组件。可以用 MapReduce 来完成,...
转载
2018-10-08 17:27:54 ·
1202 阅读 ·
0 评论