如何更好地构建我们的数据处理架构,如何对IT系统中的遗留问题进行现代化改造并将其转变为现代数据架构?该怎么为你的需求匹配最适合的架构设计呢,本文将分析两种最流行的基于速度的数据架构,为你提供一些思路。
文章速览:
- 什么是数据架构?
- 基于速度的数据架构
- 结语
一、什么是数据架构?
数据架构是企业架构中的一个元素,继承了企业架构的主要属性:流程、策略、变更管理和评估权衡。根据Open Group架构框架,数据架构是对“企业主要数据类型、来源、逻辑数据资产、物理数据资产和数据管理资源的结构和交互” 的描述。
根据数据管理知识体系,数据架构是“识别企业的数据需求(无论结构如何)并设计和维护核心蓝图以满足这些需求”的过程。它使用核心蓝图来指导数据集成、控制数据资产并使数据投资与业务战略保持一致。
然而,糟糕的数据架构是僵化且过度集中的。它使用了错误的工具来完成工作,这阻碍了开发和变更管理。
二、基于速度的数据架构
数据速度是指数据生成的速度、数据移动的速度以及将其处理为可用指导的速度。
根据处理数据的速度,数据架构通常分为两类:Lambda和Kappa。
(一)Lambda数据架构
1、什么是Lambda
Lambda数据架构由Apache Storm的创建者Nathan Ma