会话式人工智能驱动的数据分析是否终于能够解决数据民主化的难题?

原文:towardsdatascience.com/could-conversational-ai-driven-data-analytics-finally-solve-the-data-democratization-riddle-989ceec7f1e1?source=collection_archive---------11-----------------------#2024-10-01

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/89af9b5d198fef6b1eb1c52d1f313c88.png

艺术作品由 Galen Okazaki 使用 Midjourney 创作

数据领导者的现实评估

https://medium.com/@kingkoa96746?source=post_page---byline--989ceec7f1e1--------------------------------https://towardsdatascience.com/?source=post_page---byline--989ceec7f1e1-------------------------------- Galen Okazaki

·发表于 Towards Data Science ·阅读时长:7 分钟·2024 年 10 月 1 日

开场场景:未来感办公室中的高管

一间宽敞现代的办公室。落地窗提供了下方繁忙城市的全景。空间既简洁又优雅,配有光滑的极简主义家具和几件精心挑选的艺术作品挂在墙上。

一位穿着得体的 40 多岁女高管专注于她的电脑屏幕,并问道:“请显示上个月的收入。” 她瞥了一眼屏幕,面无表情,接着问道:“按销售区域划分收入。” 此时,她皱着眉头,带着疑惑的神情问道:“按区域显示净利润率。” 在长时间凝视之后,她慢慢地叹了口气,拿起了手机……

数据民主化 - 使组织中的每个人都能访问数据的过程,无论其技术能力如何。

数据民主化是一个难题,像我这样的传统拉尔夫·金博尔信徒已经尝试解决了几十年。从用户友好的数据模型(数据仓库)开始,再到如今众多高度进化、用户友好的商业智能工具,我们已经走了很长一段路。

然而,大多数时候,从数据中获取新洞察的能力仍然是数据分析师、数据科学家和业务分析师的领域。对于大多数商业组织中的其他人来说,围绕数据的技术障碍(无论是真实的还是想象的)依然存在。

一线希望?

2022 年 11 月下旬,OpenAI 发布的 ChatGPT 使得普通大众(即:非技术人员)只需输入自然语言的请求***(prompt)***,就能与大型语言模型(LLM)进行互动。通过这个对话式用户界面,用户可以向 LLM 提问,LLM 会根据其“训练”过的数据回答问题。以 ChatGPT 为例,它的训练数据来源,嗯……互联网。

ChatGPT 将强大的数据处理能力带到了任何有权限访问它的人手中。当我们意识到这一机制的潜力时,许多数据分析领域的从业者开始思考它对我们领域可能带来的影响。

我们并没有思考太久……

在 ChatGPT 首次面向公众发布仅四个月后,OpenAI 发布了一个名为Code Interpreter的 ChatGPT 插件的 alpha 版本。通过这个插件,任何人都可以将数据集加载到 ChatGPT 中,输入几个提示语,并调用 Python 执行回归分析、描述性分析,甚至创建可视化图表。所有这些都不需要写任何代码!

Code Interpreter 的发布让我们初步看到了由对话式 AI 驱动的数据分析可能是如何工作的。这简直令人震惊!

不久之后,鉴于 ChatGPT 已经具备了编写代码(例如 SQL、R、Python 等)的能力,再加上 Code Interpreter 的初步功能,许多人开始预测数据分析师角色最终将被取代。(当时,我不同意这个观点,甚至还写了一篇文章反驳它)。***

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/0fbbde7bff609592183f856bd338daaf.png

艺术作品由 Galen Okazaki 使用 Midjourney 创作

**生成型 AI 会取代数据分析师的需求吗?**Galen Okazaki 为《Towards Data Science》撰写

当然,当你考虑到即便是你公司里技术能力最弱的人也能够仅凭输入文字或甚至口头提问就从数据中提取见解时,这种预测看起来并不难以接受。

那么,对话式 AI 驱动的数据分析,是否真的能成为弥合数据与其民主化之间技术鸿沟的关键?

让我们仔细看看。

对话式 AI 驱动的数据分析的现状

所以……从 Code Interpreter 的 alpha 版本发布到现在已经快一年半了,我们在对话式 AI 驱动的数据分析方面取得了多少进展?可能没有你预期的那么多。

例如:在 2023 年 7 月,ChatGPT 的 Code Interpreter 被重新命名并作为高级数据分析重新发布。Code Interpreter 不仅名称被更改了,而且……嗯……呃……好吧,至少新名称更准确地描述了它的实际功能。🤷‍♂️

公平地说,代码解释器/高级数据分析是一个很好的工具,但它从未旨在成为企业范围的分析解决方案。它仍然只能处理您上传到其中的静态文件,因为您无法将其连接到数据库。

为了更好地了解,让我们看一些目前已经整合了对话式人工智能界面的可用分析工具。

Power BI Q&A

第一次尝试实施对话式数据分析早于 ChatGPT 发布。在 2019 年,微软广泛使用的Power BI发布了一个名为“Q&A”的功能。它允许用户用他们的自然语言输入关于他们数据的问题,只要是英语(目前是唯一支持的语言)。

这是通过嵌入在现有仪表板或报告中的文本框界面完成的。通过这个界面,用户用自然语言提出关于特定仪表板或报告背后数据集的问题。Power BI 利用***自然语言查询(NLQ)***将文本问题转换为查询。响应以可视化方式呈现。

尽管这个功能有其用途,但它有一个重要的限制。Power BI Q&A 仅限于查询查看的报告或仪表板背后的数据集,如果您的最终目标是公司范围内数据的民主化,这一范围就太窄了。

Snowflake Cortex Analyst

一个更合适的对话式人工智能驱动数据分析的例子,可能支持数据民主化的是Snowflake 的 Cortex Analyst

简而言之,Snowflake 本身是一个不断增长的 SaaS、基于云的数据仓库和分析平台,为客户提供了根据需要扩展其存储和/或计算的选项。其架构还支持高速数据处理和查询。

Cortex Analyst 是 Snowflake 的对话式人工智能驱动数据分析版本。一开始,它在一个方面远远优于 Power BI 的 Q&A,即不仅允许用户对现有报告或仪表板背后的数据集进行查询,而且 Cortex Analyst 将允许用户对整个基础数据库进行查询。它通过依赖语义层和模型来解释用户请求来实现这一点。

这带我们来到一个关键点。

拥有完全经过审查的语义层是数据民主化的绝对先决条件。在赋予公司内每个人使用数据的能力之前,必须就正在使用的数据和指标达成普遍一致的定义才是合理的。稍后会详细介绍。

尽管我在这里只讨论了两个关于对话式人工智能驱动的数据分析的例子,但它们应该足以帮助您设想它们在数据民主化中的潜在作用。

数据民主化面临的挑战

虽然以自然语言提问数据并获得答案的能力具有巨大潜力,我认为数据民主化面临的最大挑战并非技术性问题。

让我们从成功的数据民主化前提条件开始。这些条件包括强大的数据基础设施,充分解决前面提到的语义层和模型数据素养、数据质量和数据治理。这些本身就是重大项目,现实情况是,对于许多公司来说,这些仍然是正在进行中的工作。

这对于数据素养尤为重要。

也就是说,尽管 92%的企业决策者认为数据素养很重要,但目前只有 34%的公司提供数据素养培训(来源:数据素养指数,沃顿商学院)。

另一个挑战是我在整个数据分析职业生涯中一直看到的。在我的经验中,总是有一部分用户(其中一些是 C 级高管),由于各种原因,拒绝使用我们为他们创建的商业智能界面。虽然他们通常是少数人,但这提醒我们,尽管花哨的功能很吸引人,但许多人仍然固执地只愿意使用他们最熟悉的工具。

总结

成功的数据民主化努力不能仅仅依赖于某一项特定技术,无论它多么具有前景。 它需要一种具有远见的、多方位的方法,除了适当的技术外,还需要强大的数据基础设施和以数据为核心的组织思维模式。

虽然由对话式 AI 驱动的数据分析本身无法解决数据民主化的难题,但它无疑可以在整体努力中发挥重要作用。

顺便提一下:

作为一个相信赋能业务部门与数据合作的人,我认为对话式 AI 驱动的数据分析具有巨大的价值。

在我看来,至少目前,这一工具的最高效和最佳使用方式是由业务分析师掌握。鉴于他们对业务运作的深刻理解(领域知识)以及已经具备的数据素养,他们最有能力利用对话式分析工具来获得答案,而无需被复杂的代码所束缚。

AI 在数据分析中的角色令我着迷。如果你对这篇文章或 AI 在分析中的作用有任何想法或评论,我非常希望听到你的声音!欢迎直接联系我:kingkoa96746@gmail.com

给我一个关注…

如果你有兴趣看到更多关于影响数据分析领域的文章,请@关注 Galen。感谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值