数仓——为解决多系统的整合而生
用户变现 推荐 ECIF 用户管理系统 40个子系统 P2P
宜信 P2P线下、宜人贷、基金、保险、移民
证件类型 证件号码 姓名
业务逻辑
用户 产品 订单
基本信息 联系信息 证件信息 财产 星星结构 雪花结构
维度建表单表 要是 ECIF是用户集市 则分开
订单合同 高度相似性 时间 人 买什么产品 钱
合同三层
利润=收入-成本 收入来自客户:画像、分级(集团、大区、城市、门店) 成本:人力费用、成本
ods原始数据层 与数据源的数据同构 E主要 抽取
dw datawarehouse轻度汇总,明细层 ETL提取转换加载 异构的变化 T占主要 银行保险 业务种类比较多 信息和业务种类较少
dws 汇总层 报表层
aws 提供服务videology
本公司的数据仓库
客户信息、用户行为、用户付费、渠道、活动营销、任务体系、B端教师
学生、教师、家长、小学
用户的阶段不一样,用户习惯不一样 引导性学习、自主性学习
拆表 整表
小初高用户都是5000万,本公司change表。 相似性 所有公司订单表
课程、真人秀、习题 规划成一个表
数仓二期:dim_user 访问活跃
2019:订单、家长、小学
实收、到账 实收>到账(oppo) 注册用户所属班属于哪个业务群就是哪个群的 代理商—老师合作 线下渠道
举例说明会数据仓库和数据集市的区别
数据集市是基于主题的。主题下的所有表都是同一类型的表