银行账户数据分析与维度建模实践
1. 银行目标与业务需求
银行的首要目标是更好地分析账户情况。业务用户期望能够对单个账户及其所属的居民家庭分组进行细致分析。银行的一个主要目标是通过向已有一个或多个账户的家庭提供额外产品,实现更有效的营销。
在与银行的经理和分析师进行访谈后,明确了以下业务需求:
- 业务用户希望查看每个账户五年的历史月度快照数据。
- 每个账户都有一个主余额,业务希望在同一分析中对不同类型的账户进行分组,并比较主余额。
- 每种账户类型(银行内部称为产品)都有一组自定义维度属性和数值事实,且产品之间差异较大。
- 每个账户都属于一个单一家庭,但由于婚姻状况和其他生活阶段因素的变化,账户与家庭的关系存在较大波动性。
- 除了家庭识别,用户还对与单个客户和家庭相关的人口统计信息感兴趣。此外,银行会捕获并存储与每个账户和家庭的活动或特征相关的行为得分。
2. 初始模型的维度选择与问题
基于上述业务需求,初始模型的粒度和维度开始显现。可以从一个记录每个账户每月末主余额的事实表开始,该事实表的粒度是每个账户每月一行。基于此粒度声明,最初可以设想一个只有两个维度的设计:月份和账户。这两个外键构成事实表的主键。
然而,这种设计虽然准确表示了快照数据中的多对一和多对多关系,但未能充分反映自然业务维度。将所有信息都合并到庞大的账户维度表中并非最佳选择,因为额外的分析维度(如产品和分支机构)更符合用户对业务的直观理解方式。这些补充维度为事实表提供了更小的切入点,有助于实现维度模型的性能和可用性目标。
同时,大型银行可能有数百万个账户,需要担心类型 2 缓慢变化维度效应可能
超级会员免费看
订阅专栏 解锁全文
2085

被折叠的 条评论
为什么被折叠?



