3、数据网格:概念、优势与实践原则

数据网格:概念、优势与实践原则

1. 数据网格的替代方案

在数据管理中,数据网格的分散责任模式有两种主要的替代方案:
- 人员和技术集中化 :这是初创公司的默认设置。在初期,分散化的成本超过了其收益,一个数据团队紧密合作并使用单一技术会让事情变得更简单。集中化的数据工作在组织和技术层面上作为默认选项是合理的,因为它可以减轻分散化带来的成本。不过,这意味着集中化和分散化数据所带来的价值大致相等。
- 按技术拆分工作 :不按照数据网格所建议的按业务领域拆分工作,而是按技术拆分。通常会形成一个核心数据工程团队,主要负责数据摄取和提供数据存储基础设施,以及多个其他团队,如分析团队、数据科学团队等。这些团队获取原始数据并将其转化为有意义的内容。可以先集中数据系统,再采用这种方式来增加数据流动。

然而,这两种方案都无法与与业务领域紧密相关的价值创造相契合,也无法应对单个业务领域的突然变化。当增加新的数据来源或数据科学项目变得极其复杂和昂贵时,就应该考虑转向数据网格。

2. 数据网格中的数据仓库和数据湖

人们对数据网格存在一种误解,认为它是中央数据湖或中央数据仓库的排他性替代方案。但数据网格是技术和组织的结合,它是对由一个集中数据单元管理中央数据存储中数据的替代。

公司仍然可以拥有中央数据存储,同时让分散的单元来处理和拥有数据,这在对数据生产者端不需要完全灵活性的公司中是常见的实现方式。将数据湖和数据仓库保留在商业智能或数据科学团队中也是常见的做法,此时它们成为数据网格中的一个节点。数据网格会大量使用各种格式的数据湖和数据仓库,并且通常不会专注于任何特定技

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值