公司捕获和存储的数据比以往任何时候都多,因为它们依赖数据来做出关键的业务决策、改进服务或产品,或为最终用户(客户)提供更好的服务。了解各种大数据存储技术对于为商业智能(BI)、数据分析和机器学习(ML)工作负载建立强大的数据存储管道至关重要。
为了维护这样的大数据,数据湖和数据仓库架构已被公司广泛使用。但这两种体系结构都有一定的局限性,我们将在博客的后面部分讨论这些局限性,从而发现一种称为Data Lakehouse的新体系结构。
然而,在深入研究Data Lakehouse架构的细节之前,重要的是首先了解Data Lake和Data Warehouse,其中的一些局限性,以及我们为什么首先需要它们?