利用信息是一种技巧,而不是数据产品的输出。
Photo by Campaign Creators on Unsplash
对于数据专业人员来说,这是最好的时期,这是最糟糕的时期。从人类的各个方面将智能信息,统计数据和科学相结合的兴趣从未如此强烈-从复杂的业务决策和尖端产品到我们的日常任务管理,数据集成似乎无处不在。在尤瓦尔·哈拉里(Yuval Harari)的《智者》(Homo Deus)中,他提出了令人信服的论点,即"数据主义"甚至可能是下一种宗教形式-当您观察我们对这些东西的社会痴迷如何演变时,他也许会有所作为。在更广阔的业务领域看来,将数据应用于任何事物的任何事情本身都证明了这样做的合理性。在FOMO推动下,公司正在将资源投入与数据相关的技术和员工人数,其速度比您可以说的机器学习还要快。但是,就像购买昂贵的健身房会员资格不会给您Dwayne Johnson一样,仅在技术堆栈上进行大量投资就不会创建由数据驱动的决策文化。对于组织来说,要抓住以数据为中心的决策支持所能提供的机会,就需要从业务用户开始进行变更。精明的组织会围绕这些变化并不断发展,而不太精明的组织会在决策不断变化的情况下进行试验,而明智的选择会产生令人失望的结果。如果要成功执行数据计划,则需要满足以下所有条件:
· 大量资源
· 文化成熟度
· 组织智慧
可能会问一个问题:"我的公司太笨了,无法以数据为驱动力吗?"
大多数数据计划哪里出了错
要了解在成为数据驱动型游戏的过程中,将赢家与输家区分开的原因,这有助于首先了解为什么这么多数据计划会出错。 在制定组织数据策略时,大多数企业通常会创建类似于以下过程的路线图:
· 将来自不同来源的数据收集到数据仓库中
· 将数据集中到商业智能工具中
· 利用洞察力
对于技术实施团队来说,第一步似乎很容易。 他们将选择目标数据仓库或数据湖以及用于提取数据(EL)的方法,甚至可能会进行一些数据分析和建模。 第二步(加载BI工具)更加不透明。 业务用户将对仪表板,模型和图表有各种各样的要求; 有些人可能想要每个可能的数据点,而另一些人最多希望它们生成的手动报告完全相同。 该项目将继续进行,并在此过程中传递里程碑意义的目标,例如" Facebook数据已完成"。 最终,该项目将达到MVP版本! 该组织将屏住呼吸等待这些见解开始深入。
等一下
Those insights will be here any day now… (image credit RebeccaSaid )
但是无论如何,尽管在数据技术上进行了巨额投资以及项目的所谓"成功",一切照旧将继续。 仪表板将不再使用,团队将继续依赖共享的电子表格和不连贯的第三方工具集合,高管将继续在黑暗中做出决策。 发生这种情况是因为数据驱动与机器学习或人工智能,数据仓库或BI仪表板无关。 数据驱动是关于业务用户学习提出好的问题,而这是商业智能工具或数据产品无法提供的。
在上述情况下,技术组件(数据仓库,ETL流程和BI可视化)可能已正确实施。但是,能够分析业务趋势并从度量中得出准确的结论并不是标准软件工程师工具包的一部分(也不必如此)。因此,技术实施团队通常会准确地构建业务用户的要求,同时假设"利益相关者最了解他们的需求"。通常认为,向业务用户提供数据和可视化本身将导致数据驱动的决策制定。实施数据计划时,至关重要的是要了解,作为主题专家并不意味着一个人会知道如何利用有关该主题的数据。就像专业雕刻家可能不知道如何操作3D打印机一样,经验丰富的产品经理可能也不知道如何应用商业智能仪表板来推动功能改进。首次获得度量和组织知识访问权限的业务用户可能不理解他们应该问什么问题,并且他们不太可能根据收到的答案知道要采取的行动。要了解变化的长期趋势和统计意义,需要特定的技能集,并且通常不具备该技能集。
同时,企业用户将开始表现出沮丧。他们向他们提供了深刻的见解,这些见识将无情地削减开销并释放潜在的机遇,但似乎所有的商务智能工具都提供了很多复杂的图表,它们并不能真正告诉他们任何东西。他们应该对图形上的一堆波浪线或烛台图的箱形线图做什么?业务启示在哪里-屏幕上红色闪烁的警告框指示其增加关键字支出,关闭业绩不佳的仓库或更改内容标题的时态以提高读者数量?机器学习和人工智能难道不应该找到所有这些隐藏模式并巧妙地呈现它们以应对吗?相信数据产品将通过使用"魔术"算法输出可操作的方向的信念通常由与数据相关的技术新手的商业用户持有;在数据产品销售人员和媒体轰动一时之间,我们很容易理解我们对数据工具的功能有何重大误解。事实是,数据工具不能提供业务答案,而可以提供信息。将这些信息转化为答案需要用户的知识和技能。坦率地说,分析工具可以自动摄取原始数据并输出可操作的见解的想法是科幻小说,比指导委员会会议更适合于"关注的人"事件。
Quick! which one tells you how to run your business, and which one monitors hyperspace? (image credi
这些假设共同造成了挫折与失败的痛苦循环。 技术实施者无法理解为什么业务用户似乎从未从所交付的工作中获得价值,而业务用户也无法理解技术实施者为何继续交付无法执行的工作。 尽管如此,从昂贵的数据计划中获得任何收益实际上并不是最糟糕的结果。 当企业用户到达并应用错误的见解时,更具破坏性。
错误的见解:M.Python Holdings LLC。
M.Python Holdings LLC是我们虚构的房地产开发公司,在本案例中,您是读者,您将扮演商业智能实施工程师的角色。 假设首席人事官向"员工"仪表板提交了变更票,在"报告"标签中添加了"员工权重超过其各自工作地点平均离职率的信息"。 在您询问更改是否可行之前("我们甚至还有员工体重数据吗?"),您需要根据"为什么"因素对故障单进行标记; 该请求如何实现价值? 您联系CPO进行澄清,对话过程如下:
您:"您好先生。 空闲(CPO),您能告诉我您将根据此请求的输出做出的决定吗? 了解这些决定将有助于我确保所做的更改能够满足您的需求。"
CPO:"当然! 我们将使用这些数据来寻找可能对我们有用的任何女巫。"
您:"嗯..请详细说明。"
CPO:"好吧,Cleese先生(首席财务官)没有参加上周的董事会会议,但我们确实在他的办公室里找到了一只new。 所以自然而然地,我们假设一个女巫把他变成了new。 我们投票决定立即查找和删除公司中的所有女巫,并对其进行数据驱动。 因此我们认为,女巫燃烧,木头也燃烧,对吗? 当然还有木头漂浮,鸭子也漂浮。 因此,如果数据表明我们有任何雇员的体重和鸭子一样重,那他们就是巫婆!"您:(facepalms)
错误的见解,您自己的角色的统计公式以及受确认偏差严重影响的指标都特别损害组织的决策过程。 此外,当由此导致的业务崩溃崩溃时,这些受污染的可交付成果通常会在数据和实施团队中扮演替罪羊的角色。
量规和杠杆
数据驱动的决策可以归结为两个因素:可以衡量的指标(指标)以及可以做什么(指标)?提出明智问题的第一步来自对杠杆作用的详细评估。这些就是广告支出渠道,SAAS公司的技术投资决策或内容创建者的措辞选择。一旦业务用户知道他们拥有什么杠杆,下一步就是确定他们需要什么度量。这是棘手的地方。量表主要有两种形式:滞后(或描述性)和超前(或描述性)。滞后指标通常是您关心的事情(例如月收入),但是只能事后考虑。超前指标与滞后指标具有预测性关联-站点访问,单位销售或页面流量行为模式可能是每月销售滞后指标的领先指标。滞后指标是计分板,可以告诉您您的决策是否成功。但是滞后措施对于数据驱动的决策并不是天生的有用。这就是您需要铅指标的原因。识别这些主要指标是提出好问题的核心。掌握每个杠杆如何影响领先指标的业务用户将能够利用它们,并引导到滞后指标的目标,那就是由数据驱动的决策。
天气与气候
尼尔·德格拉斯·泰森(Neil deGrasse Tyson)的这段视频解释了天气和气候之间的差异,这是纯金的。
尼尔非常雄辩地提出了一个具有统计意义的例子。 这就是说,在计算气候趋势时,一月的温暖星期或八月的寒冷天气(在费城)并不重要。 当业务用户确定需要支持其杠杆的量规时,至关重要的是,他们选择的指标实际上是基于数学和科学的指标。 例如,一个零售商店的买家使用"今天的温度"的领先指标来决定库存,而只订购来年的冬衣显然是愚蠢的。 但是,如果买方使用去年的平均温度怎么办? 还是去年的最高和最低气温日期来划分季节? 还是过去十年中每天的平均温度变化? 添加一些数学知识可以使创意(尚未完善)的数据利用方法具有可信度; 不良的衡量标准通常比没有衡量标准更容易惹上麻烦。
确定组织准备情况
确定公司准备好成为数据驱动型企业的真正方法实际上是确定整个组织中具有什么级别的数据应用技能。 可以在花费一美元购买数据仓库/商业智能技术之前完成此确定,并将围绕数据计划将产生的潜在投资回报率设定现实的期望。
滞后指标很重要(请记住,这些都是衡量成功的最终指标),但在积极推动数据决策的情况下,它们的用处不大。 为了影响决策,重点应放在领先措施上。 为此,学历提升用户的任务是为其垂直行业提供简要的数据策略概述。 此概述每个数据集包含4个问题:
· 他们对该数据集有什么影响?
· 他们期望数据集到达时会是什么样?
· 他们将如何从该数据集中提取答案?
· 他们将采取什么手段对结果采取行动?
这可能是一个简单的电子表格,其中包含估计的列标题和几行清晰的文档。
A basic example of a business user action plan
在上面的答案中,我使用的统计数据超出了大多数企业用户的预期; 如果该计划显示为"计算每个渠道的投资回报率并找出下降的地方",那么该团队将可能需要分析师/数据科学家/需求计划者的帮助来确定正确的模型,这将是宝贵的见解。
数据驱动决策的新用户可能会争辩说,如果不先访问商业智能工具中的数据,他们就无法知道预期的数据或将如何使用它们。 尝试在不同的上下文中想象相同的逻辑; 假设一家工厂经理要求一台新的价值10万美元的机器用于装配线。 如果经理无法描述机器的实际功能或无法说明如何使用机器获利,但他坚持认为,一旦安装,机器将被证明是一笔巨大的投资……这听起来可笑吗? 大多数数据计划的成本远远超过10万美元的神秘机,但每天都会发生。
明智的组织如何演变为数据驱动的
通过收集潜在的度量,杠杆和结果,可以确定组织在哪些方面最好(和最差),准备将数据纳入决策。 精明的组织将使用此信息来确定最适合其当前状态的策略(如果愿意,请以数据为驱动力,以求成为数据驱动型)。 这些聪明的策略通常包括:
· 在组织内建立明确的期望。 成为数据驱动的第一步就是要毫不含糊地巩固业务的含义。 这必须明确指出,组织决策者将获得巨大的信息访问权,并且这种权力与巨大的责任相结合; 决策者将承担责任,以学习使用科学证明的方法智能地请求,解释和对业务信息采取行动的技能,并重新设置组织内智能决策的标准。 这种变化需要清晰,全面地传达,因为它重新定义了对领导者和决策者的行为期望。
· 利用现有的数据专业知识。 调查组织的当前状态可以确定已经非常熟练地从信息中提取见解的团队和团队成员。 这些"锚点"团队和团队成员可以帮助建立其他团队必须上升的趋势线,并且经常可以跨职能协作以帮助他们做到这一点。
· 集中数据计划。 内部竞争可能成为任何成为数据驱动策略的主要障碍。 为了使计划成功,它必须得到自上而下的认可,作为组织内的"单一真相"。 这消除了业务孤岛,并允许洞察力在垂直行业之间传播,并确保滞后和超前措施在整个组织中都得到遵守。
· 将组织的有限资源集中在数据将产生最大影响的地方。 如果大多数业务需要帮助确定和建模领导措施,并且该组织很少有数据科学家或分析师,那么可行的解决方案是从回报最大的团队开始,并始终专注于这些领域。 这意味着不尝试在整个组织中引入商业智能工具,而是在资源可用时在次高价值的应用程序上进行迭代。 数据熟练程度是累积的,随着业务用户获得数据读写能力,他们将变得更加自给自足。
· 鼓励业务用户学习如何解释和计算简单统计信息。 为了使组织真正地由数据驱动,每个团队成员都必须能够使用和正确应用数据产品。 业务用户必须超越反动的"针头移动"仪表板,并学会解释丰富的统计指标。
· 考虑放弃或至少推迟成为数据驱动的选项。 与普遍的看法相反,并非所有组织都需要立即成为数据驱动的组织才能成功。 对于某些人来说,将资源投入到数据计划中可能会浪费时间和精力,而可以将其更好地分配到其他地方。 精明的组织不会排除数据驱动决策完全不会成为数据驱动的可能性。
不太聪明的组织如何失败
· 喂养流行语火焰。 在定义组织的数据计划目标时,自上而下的消息传递通常类似于企业网站底部的点击诱饵。 依靠魔术算法和功能强大的机器学习技术来迎合流行文化的痴迷,不仅是噪音;还有 词汇使组织陷入失败和失望的境地。 聪明的组织对数据计划将(可能不会)实现的现实抱有现实的期望,而愚蠢的组织则传播科幻小说。
· 关注滞后指标。 使用KPI仪表板来告知决策,就像使用足球比赛的终点得分来决定您应该打的那场比赛。 愚蠢的组织将在整个月中圈出这些最终数字,同时继续猜测哪些行动可能会对他们产生实际影响。
· 选择数量胜于质量。 发起数据驱动的计划时,常见的(极其失败的)策略是通过尽可能多地将低质量,近乎原始状态的数据集分发给业务用户群来尝试并取悦所有人。 我们的想法是,任何数据总比没有数据要好,未来的改进可以集中在准确性和可访问性上。 这是在错误的结论和矛盾的事实中乱扔决策环境的可靠方法,同时破坏了利益相关者对数据生态系统的信心。
· 将遗产和资历领先于科学。办公室政治对数据主动部署的影响通常与聪明和愚蠢的组织形成鲜明对比。随着公司采用单一数据源并要求决策者对将分析应用于其流程负责,不可避免地会遇到麻烦。一些团队会拒绝与组织一起进行更改,因为他们将更改视为不必要的工作;其他人可能会悄悄地拒绝傲慢自大,认为他们没有从应用洞察力或统计数据中获益。然后,有一些团队拒绝集中式数据计划,因此他们可以继续控制自己的指标(当然,在过程中向数据添加友好的倾向)。愚蠢的组织会逐个例外地进行例外处理,从而使决策演变为正确的业务逻辑之战;集中的真相来源,还是多年以来一直值得信赖的"大型电子表格"?如果组织要成为数据驱动型组织,则必须立足于其所相信的数据,并毫无例外地致力于该决策。一个特别具有挑战性的情况是,坚持派恰好是高级领导层的一员。没有什么能使组织的集会大放异彩以应用领先的度量标准来指导可采取行动的决策,例如高层管理人员坚持统计上不准确的度量标准,固定滞后的度量标准或将不受信任的度量标准从数据驱动的计划外部获取。一个组织的行为举止很少比领导它的领导更聪明,在这种情况下,愚蠢的结果很难避免。
在结束时
像许多其他业务计划一样,转变组织以利用数据驱动的决策实际上是在转变其员工的行为和技能。 了解这一点并进行相应投资的公司将发现,数据创造了新的商机。 专注于技术,流行语和科幻小说的公司将发现数据是另一项失败的投资。