
数据仓库与ETL
BrightSea
真相是个极限,只能无限接近
展开
-
关于建立数据仓库应用层的数据模型
定义任何应用的数据模型都是项复杂的任务,对于数据挖掘也不例外。实际的挖掘中,有两种定义数据模型的方法:一是建立公共的数据模型,这个模型为上层所有的应用所共用,但是这一方法需要一个较为长期的过程,而且由于上层应用的多样性与不可预知性,常常会无法确定变量是否重要,也就无法确定变量原创 2011-01-14 09:59:00 · 1435 阅读 · 0 评论 -
即席查询
在数据仓库领域有一个概念叫Ad hoc queries,中文一般翻译为“即席查询”。即席查询(Ad Hoc)是用户根据自己的需求,灵活的选择查询条件,系统能够根据用户的选择生成相应的统计报表。 即席查询与普通应用查询最大的不同是普通的应用查询是定制开发的,而即席查询是由原创 2010-12-23 13:23:00 · 1598 阅读 · 0 评论 -
ETL需要明确的六个基本问题
1、是否需要使用第三方软件来实现?2、在哪些地方需要对数据进行整合,如何整合?3、应该选择哪种数据变更捕获机制?4、什么时候对数据进行组织和筹划(即在何时对数据进行stage处理)5、应该在哪个阶段对数据质量进行提升?6、应该支持怎样的数据延迟水平?原创 2010-09-29 23:14:00 · 651 阅读 · 0 评论