今天,我们将展开说说 DataOps,以及为什么它对于每一个想要真正实现数据赋能业务的企业都很重要。
一、DataOps 是什么
DataOps(Data Operations)并不是一个新的概念,根据 维基百科 的说明,早在 2014 年就被 IBM(Lenny Liebmann)提出,在 2017 年得到大范围关注,并在 2018 年正式被纳入 Gartner 的数据管理技术成熟度曲线当中。
今年,中国信通院正式牵头启动了 DataOps 的标准建设工作,以此为基础推动我国大数据产业的多元化发展,为企业经营决策提供数据支持。
同时需注意的一点, DataOps 不是一个工具或产品,可以理解成一种「方法论,或者最佳实践」,类似软件开发中的「敏捷方法」 。不能以功能的视角去看待 DataOps,而是以「我应该如何做」的视角来看待此问题。
DataOps 的目标是提供工具、过程以及结构化的方式来应对快速增长的数据,对企业内的数据团队赋能,能够使企业内的数据团队更高效、高质量的完成数据分析,它强调交流、协作、多系统集成以及自动化流程,并配套具备对应的度量方式。
二、DataOps 的涵盖内容
下图为标准的 DataOps 涵盖的内容,主要包括数据技术、数据管道、数据处理 3 个方面,最终为商业用户输出价值。
原图出自: