数据仓库探索与替代存储:优化数据管理的关键策略
1. 探索仓库的构建与优势
探索仓库的构建为数据仓库带来了显著的优势。当探索仓库建成后,可以对数据仓库运行任意数量的长查询,而不会产生不良影响。数据可以直接从替代存储传递到探索仓库,这避免了大量的基础设施成本。
探索处理与数据仓库环境相互隔离。探索者可以执行任意数量的长时间运行的查询,而无需考虑对数据仓库常规用户性能的影响。
2. 何时需要探索仓库
公司对探索仓库的需求程度取决于其执行长时间运行查询的频率。以下是不同查询频率下对探索仓库的需求情况:
| 查询频率 | 探索仓库需求情况 |
| ---- | ---- |
| 每年 1 次 | 不需要探索仓库 |
| 每季度 1 次 | 可能不需要探索仓库 |
| 每月 1 次 | 可能需要考虑构建探索仓库 |
| 每周 1 次 | 需要探索仓库 |
| 每天 1 次 | 必须有探索仓库 |
3. 探索查询为何如此漫长
探索查询通常较长,并非是探索者不擅长编写高效查询,而是因为这些查询需要处理详细数据、历史数据以及以不寻常方式配置的数据。当将详细数据、历史数据和多种连接/合并方式相乘时,就会导致查询运行时间变长。
4. 冻结探索数据
探索仓库的一个独特特征是在分析期间需要冻结数据。在大多数数据库环境中,希望数据尽可能保持最新,但探索仓库几乎需要完全相反的处理方式。
迭代分析是对探索仓库进行的一种分析类型。在迭代分析中,分析师先进行一种分析,然后根据结果进行下一种分析。由于一次分析的结果为
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



