维度整合
对多中源数据的整合:
1.表,字段命名规范统一
2.字段类型统一 字段长度统一
3.公共代码,代码值统一
4.含义类似表的统一:
4.1 主从 共有字段组成主表,其他字段存在原有表内形成从表 主键关联
4.2 合并 所有字段都在一张表中 空值可能较多
4.3 不合并 差异太大就不合并了
对表的整合
1.垂直整合 将同一数据集 主体相同 属性不同
添加属性 不添加行数 大宽表
2.水平整合 字段属性大多一样
添加行数 统一主键 注重相同数据的合并
对表的拆分
1.水平拆分 行数不变 将属性分类划分到多张表中
基本信息表(部分主要属性,常用)
和附加信息表(部分特有属性,不常用)
2垂直拆分 行数减少
存在部分数据存在特殊维度属性
由于时效问题 部分数据访问多 部分数据访问少
最近代码表 与 之前代码表