数据仓库设计与商业智能:从概念到实践
1. 商业智能概述
商业智能(BI)在数据仓库的语境下,是企业研究过去的行为和行动,以了解组织的过往、确定当前状况,并预测或改变未来走向的能力。BI 已经发展了 20 多年,过去十年的发展历程值得回顾。
技术采用曲线是我们理解新技术普及过程的一个重要工具。新技术刚出现时,只有创新者会率先采用,接着是早期采用者、早期多数、晚期多数,最后是落后者。以手机为例,最初只有少数创新者(如医生和律师)使用,那时手机又大又重且价格昂贵,信号也不稳定。而现在,只需 60 美元左右就能买到手机,运营商还会赠送 25 美元的通话时长,且没有月费,信号也十分可靠。
数据仓库的发展也遵循这一曲线。如今,如果还未启动第一个数据仓库项目,现在正是绝佳时机。如今的企业高管期望并常常能获得及时、优质的信息,以便做出明智决策引领公司发展。但在十年前,情况并非如此。当时,高管们批准开发执行信息系统(EIS)来满足需求,其初衷是为高管提供易于获取的关键绩效信息。然而,许多 EIS 系统未能达到目标,主要原因是底层架构无法快速响应企业环境的变化,且为高管提供所需数据的过程极其繁琐。
数据获取,即提取、转换和加载(ETL)过程,是一套复杂的活动,旨在获取最准确、集成的数据,并通过数据仓库或运营数据存储(ODS)使其可供企业使用。最初,这一过程完全依赖人工,通过硬编码的“数据抽取器”从运营系统中提取数据供业务分析师使用,就像早期电话接线员需要手动插拔电话线来连接通话一样。
幸运的是,如今数据仓库行业已经开发出大量工具和技术来支持数据获取过程,大部分工作已实现自动化。不过,这一过程仍然复杂且具有挑战性,不同公司面临的问题也各不相同。如今,大多数进行
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



