数据建模技术全面解析与零售案例实践
1. 常见维度建模技术
1.1 文本评论维度
不要将自由格式的评论作为事实表中的文本指标,而应将其存储在事实表之外的单独评论维度中(如果评论的基数与唯一交易的数量匹配,也可作为每个交易一行的维度中的属性),并在事实表中设置相应的外键。
1.2 多时区处理
在多时区应用中,为了同时捕获通用标准时间和本地时间,应在受影响的事实表中设置两个外键,分别连接到两个扮演不同角色的日期(可能还包括一天中的时间)维度表。
1.3 度量类型维度
当事实表中有一长串稀疏填充的事实时,有人会想创建一个度量类型维度,将事实表行合并为一个由度量类型维度标识的通用事实。但一般不建议这样做,因为虽然它能去除空的事实列,但会使事实表的大小乘以每行中占用列的平均数量,还会使列内计算变得更困难。不过,当潜在事实数量极多(数百个),且每个事实表行适用的事实较少时,这种技术是可以接受的。
1.4 步骤维度
像网页事件这样的顺序流程,通常在事务事实表中为每个步骤设置单独的行。为了表明单个步骤在整个会话中的位置,会使用一个步骤维度,显示当前步骤的编号以及完成会话还需要多少步骤。
1.5 热交换维度
当同一个事实表要与同一维度的不同副本交替配对时,会使用热交换维度。例如,一个包含股票行情的事实表可以同时向多个不同的投资者展示,每个投资者对不同的股票有独特的专有属性。
1.6 抽象通用维度
一些建模者喜欢抽象通用维度,比如用一个通用的位置维度代替商店、仓库和客户维度中的地理属性,或者在人员维
超级会员免费看
订阅专栏 解锁全文
1238

被折叠的 条评论
为什么被折叠?



