越来越多的业务用户希望数据仓库能够全天候地持续更新,并且越来越对旧的数据无法忍受。创建一个实时的DW/BI系统需要为实时数据收集高度概括性的真实业务需求,并且确定一个恰当的ETL架构,将多种技术整合到一个固化的平台中。
实时的分类
将实时设计分为即时、频繁和日常三个类别。
实时的权衡
响应实时需求意味着需要改变DW/BI架构来使数据能够更快地显示在用户屏幕上,则需要在数据质量和管理方面做出权衡。
对于推动实时提交的过程中,如果还像以前一样关注数据质量、集成、安全性、合规性、备份、恢复的存档,需要认真考虑一下事项。
- 从消息队列或者事物日志文件中读取数据的方式来替代批处理文件抽取
- 仅用于筛选和简单编码查找的约束数据质量筛选
- 允许将提前到达的事实存放在维的旧副本中
- 除去数据登台
呈现服务器上的实时分区
这个还没看懂啥意思
- 事物粒度实时分区
- 周期快照实时分区