抽取、转换和装载介绍(八)实时的意义(待续)

随着业务需求的增长,越来越多的用户希望数据仓库能实现24小时不间断更新。本文探讨了实时数据仓库的设计理念,包括如何根据真实业务需求进行数据收集、选择合适的ETL架构,以及在数据质量、管理和响应速度之间取得平衡。

越来越多的业务用户希望数据仓库能够全天候地持续更新,并且越来越对旧的数据无法忍受。创建一个实时的DW/BI系统需要为实时数据收集高度概括性的真实业务需求,并且确定一个恰当的ETL架构,将多种技术整合到一个固化的平台中。

实时的分类

将实时设计分为即时、频繁和日常三个类别。

实时的权衡

响应实时需求意味着需要改变DW/BI架构来使数据能够更快地显示在用户屏幕上,则需要在数据质量和管理方面做出权衡。

对于推动实时提交的过程中,如果还像以前一样关注数据质量、集成、安全性、合规性、备份、恢复的存档,需要认真考虑一下事项。

  • 从消息队列或者事物日志文件中读取数据的方式来替代批处理文件抽取
  • 仅用于筛选和简单编码查找的约束数据质量筛选
  • 允许将提前到达的事实存放在维的旧副本中
  • 除去数据登台

呈现服务器上的实时分区

这个还没看懂啥意思

  • 事物粒度实时分区
  • 周期快照实时分区

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值