金融服务与电信行业数据建模深度解析
金融服务数据建模要点
迷你维度相关要点
迷你维度应由相关的属性组构成,每个属性不应单独成为一个迷你维度,否则事实表中的维度会过多。为了保持合理的迷你维度行数,通常需要对属性值进行分组。例如,不存储像 $31,257.98 这样极其离散的收入金额,而是在迷你维度中存储如 $30,000 到 $34,999 这样的收入范围。同样,盈利能力得分范围从 1 到 1200,可以在迷你维度中划分为小于等于 100、101 到 150、151 到 200 等固定范围。
不过,分组值在两种情况下可能不够用:
- 数据挖掘分析通常需要离散值而非固定分组才能有效进行。
- 少数高级分析师可能想分析离散值,以确定分组是否合适。
在这些情况下,仍需保留分组值迷你维度属性以支持日常分析报告的一致性,同时将关键离散数值作为事实存储在事实表中。例如,若每个账户的盈利能力得分每月重新计算,每月为该得分分配适当的盈利能力范围迷你维度,同时将离散的盈利能力得分作为事实记录在每月账户快照事实表中。必要时,当前盈利能力范围或得分可包含在账户维度中,任何更改通过故意覆盖类型 1 属性来处理。每个数据元素都应进行唯一标记以便区分。设计师必须仔细权衡包含这些有些冗余的事实和属性所带来的增量价值,以及 ETL 处理和 BI 展示增加的复杂性成本。
向桥接表添加迷你维度
在银行账户示例中,如果账户维度和客户维度都是缓慢变化的类型 2 维度(通过发行带有新键的新行来跟踪历史),账户 - 客户桥接表可能会变得非常大。若有 2000 万个账户和 2500 万个客户,几年后桥接表可能会增长到数亿行。
<
超级会员免费看
订阅专栏 解锁全文
68

被折叠的 条评论
为什么被折叠?



