1.粒度:数据仓库中数据单元的细节程度的级别。细节程度越高,粒度级别越低。比如一个顾客一个月的所有通话细节,一个顾客一个月的通话的综合。因为粒度决定着数据仓库中数据量的大小以及数据仓库所能回答的数据类型。
2.活样本数据库:当数据仓库的数据增长到非常大时,可以采用活样本数据库,他是从数据仓库中取得的真是档案数据的一个子集,但是其使用有限,一般用于统计分析或者观察发展趋势。当数据必须以整体观察时活样本数据库能提供非常理想的结果。但不适用于处理单个的数据记录。
3.数据分区:将数据分散到可独立处理的物理单元中,具有更好的灵活性,也便于进行管理,比如按照时间、业务类型、地理位置、、组织单元等进行分区。