用空间换时间,通过大量的预处理来提升应用系统的效率,因此数据仓库会存在大量的冗余数据。通过数据分层管理可以简化数据清洗过程,相当于把一个复杂的工作拆成了多个简单的工作,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。如果不分层的话,如果原业务系统发生变化会影响整个数据清洗过程,工作量巨大