数据仓库开发方法与需求定义
1. 迭代开发方法
在数据仓库开发中,迭代开发方法有其独特的优势和流程。通常会经历多次迭代来逐步构建完整的系统。
1.1 第二次迭代
第二次迭代主要是构建支持 CRM 数据集市所需的所有组件,包括 ETL(Extract, Transform, Load)、数据存储、应用程序、数据质量和元数据。与第一次迭代相比,这次通常更容易,原因如下:
- 开发人员积累了开发、测试和部署到生产环境的经验。
- 开发、质量保证(QA)和生产环境已经正确设置和配置。
- 用户对系统有了预期,不会有意外情况。
1.2 最后一次迭代
最后一次迭代将交付剩余的功能,即销售和库存数据集市。在这次迭代中,可以根据前两次迭代的用户反馈来处理变更请求。活动与前两次迭代相同,从收集需求到将所有内容移交给生产团队,构建的组件也相同,包括 ETL 系统、元数据系统、数据质量系统、数据存储和前端应用程序。
1.3 迭代方法的优缺点
| 优点 | 缺点 |
|---|---|
| 最小化风险,项目更有可能成功,交付的系统质量更高 | 基础设施需要提前交付 |
1.4 迭代方法与瀑布方法对比
瀑布方法常用于软件开发,包括数据仓库开发,有三个主要工作流:ETL、数据存储和前端应用程序。瀑布方法只上线一次,而迭代方法会多
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



