商业智能解决方案的数据建模
1. 关系类型与事实列表
不同的关系类型含义相近,但存在概念上的差异。例如,在客户区域与客户的关系中,是一对多的关系,即一个区域可以有多个客户,但每个客户只属于一个区域;而客户国家代码与客户国家是一对一的关系,一个国家只有一个国家代码,一个国家代码也只对应一个国家。此外,货币和状态维度在初始版本中被定义为单属性维度。
在进行图形分析时,还需要列出项目中想要分析的事实列表,并描述其来源和条件。
2. 物理模型
物理模型是数据建模的最后一步。此前,我们与关键用户沟通,了解并记录他们的需求,定义了模型中涉及的逻辑实体及其关系,分析了模型中的维度、事实以及维度内使用的属性。现在,要在数据库中创建对象之前完成物理模型的最后步骤。
使用数据建模工具在这一步非常有用。在图形界面中定义表结构、列、列类型、主键、外键等后,多数工具可以生成在数据库中执行的创建脚本,或者直接创建相关对象。
2.1 表的定义
物理模型的主要对象是用于存储信息的表,这些表与实体直接相关,每个实体都将映射到一个物理表。根据数据库的可用选项,可以为每个表定义一些参数,如分区、位置、模式或所有者、压缩等,这些参数会因数据库软件和建模软件的不同而有所变化。
2.2 字段的定义
接下来要定义表中的字段,这些字段与逻辑和维度模型的属性密切相关。对于字段,需要遵循命名约定定义名称,字段类型通常为数值、字符或日期,根据数据库的不同有不同的子类型。同时,还要定义字段的大小、精度以及其他参数,如是否允许为空等,这些也取决于数据库和数据建模工具。
商业智能中的数据建模实践
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



