简介
先介绍一下爱奇艺公司整体的业务情况以及数据仓库 1.0 的设计和出现的问题,针对数仓 1.0 的缺陷,是如何演进到数仓 2.0 架构以及数仓 2.0 需要解决的问题和需要达成的目标。
这张图非常清晰的展示了爱奇艺的产品矩阵,早期爱奇艺是视频业务,后来从视频业务周边衍生出来一些新的业务,以视频业务为主围绕着核心 IP,衍生出短视频、小视频、奇巴布、爱奇艺阅读、叭哒、泡泡、奇秀直播、爱奇艺知识、体育、电商等众多业务,从苹果树到苹果园构建了泛娱乐生态矩阵。
可以看到产品矩阵中涉及的业务很多,每个业务都会产生自己的数据,同时也有着自己独特的产品形态。既要满足在某个特定业务场景下进行面向业务的数据探查和分析,还要基于跨多个业务场景下,从多个业务共性的角度去提取、淬炼通用的数据,实现跨业务横向的探索分析,从而实现指导业务、对业务进行数据赋能的目标。同时,每个业务之间也会相互辅助、作用,导致每个业务之间会有频繁的数据交互。
一、数据仓库 1.0
数据仓库 1.0 的架构图如上,整体分层分为 5 个部分,最下面是原始数据层,再上面分别是明细层,聚合层以及应用