数据价值血统,终于有了意义?

原文:towardsdatascience.com/data-value-lineage-meaning-at-last-c1ca82e93d29?source=collection_archive---------2-----------------------#2024-08-04

最大化你数据的商业价值

https://medium.com/@marcdelbaere?source=post_page---byline--c1ca82e93d29--------------------------------https://towardsdatascience.com/?source=post_page---byline--c1ca82e93d29-------------------------------- Marc Delbaere

·发布于Towards Data Science ·8 分钟阅读·2024 年 8 月 4 日

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/26c07c56f6168ebac0407363afd85a5b.png

图片由作者提供(其中一些我已经读过!)

介绍

我一直对那些能够完美捕捉概念本质的词汇情有独钟。在一次前往日本的旅行中,我发现了一个词——Tsundoku。它指的是购书并将其堆积,却没有阅读的习惯。我立即爱上了这个词,因为像许多人一样,我也有买书多于能读完的习惯。有些书我最终会读到,而另一些则会悄悄堆积起来。

这些未读书籍的堆积,既让人觉得有趣,又带来一种奇异的满足感——它们象征着潜在的知识和收藏的乐趣。它们作为我们智力追求的见证,即使我们并不总是能实现这些追求。

作为Kindata.io的创始人,以及在数据价值方面为大公司提供咨询的顾问,我经常遇到一些让我想大喊“Tsundoku!”的情况。这些数据目录,就像一堆未读的书,充满了对数据的详细描述,而这些数据却闲置在那里,给人一种虚假的成就感。一本未读的书是浪费知识;同样,未被用于商业价值的数据也是浪费潜力。

没有人喜欢浪费,而我合作的专业人士也不例外。他们渴望看到自己的数据被充分利用。他们也理解,要实现这一目标需要改变思维方式。作为数据领域的从业者,他们也深知良好命名的概念的力量。我听到过很多用于描述这项工作与业务价值对齐的术语,但我不得不说,我已经喜欢上了一个正在流行的术语:**数据价值血统。**这个术语深深地触动了我,因为它完美地捕捉了我所提倡的内容。它突出了一个必要性,即通过确保数据团队所做的一切都与价值创造紧密相关,从而将闲置的数据转化为可操作的洞察。

乍一看,选择用一种方式命名概念而不是另一种方式似乎无关紧要。然而,命名概念是很有力量的,尤其是在你需要带领整个组织时。

在接下来的章节中,我们将深入探讨数据价值血统的具体细节。在定义这个概念及其包含的内容后,我们将探讨如何在数据组织中以务实的方式开始实施。

数据价值血统——一个正式的定义

数据价值血统是数据专业人士常用的两个术语的聚合:数据血统数据价值。让我们回到这些概念的根本。

数据血统

数据血统由IBM 知识中心定义:

“数据血统是跟踪数据流动过程的过程,提供清晰的理解,说明数据的来源、如何变化以及最终在数据管道中的去向。”

数据价值

“数据价值是组织可以从其数据中获得的经济价值。这包括像收入创造和成本节约这样的有形利益,也包括像改进决策、提升客户体验和增强竞争优势这样的无形利益。”

这个定义是从行业中普遍接受的原则中提炼出来的,目前没有直接的权威来源。

调和两个不同的世界

前两个定义把我们引向了不同的方向。数据血统完全是关于理解依赖关系、偏差和潜在质量问题的。它提供了可解释性,并帮助数据工程团队修复断裂的管道。实际上,它是你数据供应链的正式描述。然而,对于大多数人来说,它停留在数据被应用程序有效使用的阶段。

数据价值则关注完全不同的东西:数据对组织业务目标的贡献。其潜在假设是,这个数据价值是可以正式衡量的。我们已经完全进入了战略、财务和商业案例的领域,而不是管道调试的世界。

现在我想象着尚-克劳德·范·达美正在两堆未读的书上做他那传奇的劈叉,并且非常认真地思考如何统一这两个概念……

数据价值血统的正式定义

这是数据价值血统的第一个正式定义。

“数据价值血统是一个随着时间推移,调和企业数据资产及其成本与它们对企业价值驱动因素的实际贡献的过程。”

到这里,我们有了正式的定义!我想强调这个定义中的几个方面,我认为它们是基础性的:

  • 过程:这不仅仅是事后提供文档,而是确保组织在其标准的工作方式中,考虑到与业务价值之间的联系。

  • 随着时间的推移:事物会发生变化,贡献对业务目标的影响也不例外。在某一时刻为价值提供元素的数据,仅仅是那时的价值,没有更多,也没有更少,并且没有任何保证这个价值会随着时间的推移保持不变。

  • 企业数据资产:需要考虑的主要资产是数据产品(即产品化的数据集)和业务用例(如人工智能/机器学习或商业智能项目,为企业创造商业价值)。

  • 它们的成本:创建并保持数据资产供消费使用是有成本的。部分成本来自云资源(这与财务操作实践相连),但更大一部分是数据工程师花费的时间,用于创建、维护、修复和发展这些资产。

  • 实际贡献:我们希望尽可能地正式化对业务价值的贡献。关键是,这些测量应该由业务赞助人来执行,而不是在数据组织内完成。我们还必须在这些测量中保持务实,这只是手段,而非目的。

  • 企业价值驱动因素:任何企业所重视的东西,无论是财务方面(如成本节省、创造新收入)还是非财务方面(如客户满意度、可持续性目标等)。

正如你所见,数据价值血统虽然本质上是一个简单的概念,但涵盖了非常广泛的范围。不可避免地,这涉及将组织内具有截然不同背景、使命和关切的人员汇聚在一起。让我们探讨如何务实地推动事情朝着正确的方向发展。

一种务实的方式

一些变革管理的考虑

跨越组织边界和思维方式的思考与行动并非易事。惯性是一个强大的力量,而在大公司中,有时唯一能推动进展的办法就是给自己戴上“眼罩”。

通过我亲自推动或观察的多个变革管理项目,我发现有三个关键的成功因素是始终有效的:

  • 意义和价值:当变革“看起来合情合理”时,更容易被采纳。这最终会导致一种情感:“我们为什么一直没这么做?”当新的方法感觉直观且明显更好时,抵抗情绪会显著减少。

  • 现有实践的自然延伸:如果变革对当前实践的偏离最小,变革更有可能成功。通过让人们继续做他们之前在做的大部分事情,并持续地进行小的变革,你可以将新的实践顺利地融入他们的日常工作中。

  • 即时感知价值:为了让任何变革被接受,个体需要看到立即的好处。如果那些以前困难或难以触及的事情变得容易和自然,人们更有可能热情地采纳新实践。

好消息是,通过数据价值谱系实现这三个目标是相对容易的。

  • 意义和价值:不需要进行大量研究,就可以发现资源配置和数据生产者与消费者之间的协作中存在着大量低效之处。同时,数据价值谱系的概念对不同角色而言也非常自然。

  • 现有实践的自然延伸:你并不会从根本上改变所做的事情,只是在原有工作之上添加一层薄薄的额外层,使得那些原本难以建立的联系变得可能。你可以利用现有的数据治理和财务控制投资,并激活这些资源,专注于创造业务价值。

  • 即时感知价值:通过连接各个点,你可以快速识别数据中的潜在未开发价值,提升数据资源的业务吞吐量,改善数据发现流程,并促进数据民主化。

开始入手

我发现在组织内部推广数据价值谱系方法时,尤其有用的是从三个基本问题开始:什么、如何、为什么。虽然听起来简单,但实际上大多数组织会将这三个问题混在一起,最终无法得到明确的答案。

什么指的是企业重视的数据倡议。在我们执行的项目中,这涵盖了传统分析项目(仪表板、报告等)以及数据科学/人工智能倡议(预测模型、推荐引擎、聊天机器人等)。我们用来描述一个能够提供切实商业价值的数据驱动项目的术语是商业用例

如何涵盖了多个方面,但从数据价值谱系的角度来看,最重要的一个方面是数据源的选择。越来越多的组织,受到数据网格原则的启发,开始采用数据产品或产品化数据集的概念。与商业用例不同,在这种术语下,数据产品并不直接贡献商业价值,但它们会带来维护成本。

为什么是关于对业务价值的贡献。你期望每个商业用例如何贡献一个或多个价值驱动因素?一旦项目交付并进入维护阶段,这种贡献是否能够持续?

一旦我们清楚地理解了这三个问题,我们就可以开始记录基本构建块:

  • 价值驱动因素及其度量指标

  • 商业用例组合

  • 数据产品目录

数据价值血统的第一个实际层面是定义这三个层级之间的关系。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/18b9cc4e2bdf1334ef0720194a5b9134.png

连接点 — 由 Gilles Lenoble 为 Kindata.io 创作的图片

让我们举一个非常简单的例子:

你希望通过数据驱动的方法优化能源消耗。商业用例(降低能源成本)从两个数据产品(公司能源消耗和公用事业账单及费用)中获取数据。它为两个商业驱动因素做出贡献:成本降低和可持续性。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/b69db36ecff194edcdbac116b7abff1f.png

一个数据价值血统的例子 — 作者通过 Kindata.io 的截图制作

数据产品、商业用例和价值驱动因素之间的箭头是数据价值血统的骨干。它们将三个基本问题连接起来。你会注意到这些箭头是双向的:

  • 当你从数据产品到价值驱动因素进行导航时,你可以清楚地看到数据产品的实际有用性。每个单独的数据产品确实是许多类似消费链条的一部分,你可以随时轻松了解所生成的价值。如果生成的价值未达到你的预期,你可以采取纠正措施,如内部推广、重构或停用。

  • 当你从商业驱动因素到数据产品进行导航时,你可以获得一个最新的自上而下的关于数据驱动贡献的视图。同样,如果该视图未能符合你的预期,你可以采取战略决策,从投资数据供应链、交付特定的新商业用例或提升现有用例的使用等方面入手。

总结

数据价值血统是一个强大的概念,它提供了一种结构化的方法,确保你组织中的每一条数据都能为商业价值做出贡献。通过协调数据资产、任务和商业结果,你可以最大化数据项目的影响力。

这也是一个很好的名称,可以将数据、业务和财务控制组织的人们团结在一起。

不要满足于创建几十个未被充分利用的数据产品,陷入自我欺骗的价值生成幻觉中。避免像禅修般沉浸于未使用的数据堆积中,类似于积读书风格。相反,采取行动,通过数据价值血统充分利用数据的全部潜力,确保每一个努力都能直接为商业价值的生成做出贡献。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值