新兴技术没有方法论一切都是空谈

原文:towardsdatascience.com/emerging-tech-is-nothing-without-methodology-44df8cbafd85?source=collection_archive---------4-----------------------#2024-09-19

或者:解决复杂问题的百种方法

https://medium.com/@mel.merigold?source=post_page---byline--44df8cbafd85--------------------------------https://towardsdatascience.com/?source=post_page---byline--44df8cbafd85-------------------------------- Mel Richey, PhD

·发表于Towards Data Science ·5 分钟阅读·2024 年 9 月 19 日

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5a609a643bcfb52c24374c54f7218f76.png

DALL-E 图像生成器

多年来,我一直自我介绍为一名分析方法学家。这与我的正式学术训练以及我选择的职业路径相一致。这一说法常常引起困惑、好奇,甚至有时遭到反对。对许多人而言,方法学家通才同义,而在技术实现和人工智能备受关注的当下,没人愿意成为这种角色。

传统上,方法学家是那些研究定性和定量研究方法的人。从词源学的角度看,“研究”意味着‘去寻求:’一项“创造性且系统性的工作,旨在增加知识储备。”(OECD《弗拉斯卡提手册》2015 年)

一项创造性系统性的工作…

不管是否与研究方法相关,实践中的方法学家都是应对复杂问题的百科全书。方法是一种做事的方式;一种思路。我认为,任何行业中,扎实的科学和高质量的解决方案的核心正是方法论。本文的其余部分将倡导将方法论视为一门学科。

关于方法论

在设计技术或分析解决方案时,我们通常是从我们希望达到的目标倒推。好的科学方法要求先明确问题,再选择相关的方法以达成可行的解决方案。然后,我们要使用相应的技术实施这些方法,并填充所需的数据。换句话说,数据为技术提供支持,技术实施方法,而方法的结合则解决问题。

例如,如果我们试图解决的问题是 COVID-19 的传播,我们可能会追求如图所示的接触追踪解决方案的提炼。接触追踪的候选解决方案可能涉及两种方法:1)接触的社交网络分析,和 2)传播的数学建模(例如 SEIR 模型)。这些方法的技术实现将涉及选定的技术或软件产品,以及相关的数据集。设计概念性解决方案的工作是方法学家和数据科学家的任务,而设计技术架构的工作是解决方案架构师和工程师的任务。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/44f2b33dddfbdfe5e1922d8eb235b260.png

图片来自作者

分析方法论的优势在于能够识别多种相关方法来解决问题,并理解实现这些方法所需的技术组件。它既需要创造力,又需要一个系统化的过程,以理解多种方法,快速测试它们,并推动其中一种方法走向最终解决方案。

在研究项目中,这个过程通常需要数年时间和多篇学术出版物。而在技术项目中,这应该是在几周内完成的工作。它需要科学的思维方式以及灵活的创造力和实验能力。

方法论与数据科学

那么,分析方法论与数据科学或“人工智能/机器学习”(AI/ML)之间的关系是什么呢?我们看到,机器学习(ML)和人工智能(AI)近年来备受关注。从方法论的角度来看,我们能够将 AI(作为一门科学领域)和 ML(作为一系列方法)与其他技术方法放在一起。即使是备受瞩目的生成性 AI,也只是无监督学习的一个增量性发展,尽管它是一个相当创新的进展。

作为一名方法学家,我一直觉得很奇怪,为什么机器学习如此受到关注,而其他方法却仍然处于行业的阴影中(比如基于代理的建模…)。美国国防部觉得它足够特殊,以至于成立了一个全新的机构:联合人工智能中心(JAIC),现在是首席数字与人工智能办公室(CDAO)。美国国会已经指定了为机器学习算法和生成性 AI 应用提供资金的资金流。

我不知道还有其他方法拥有自己国会指定的资金流。那么,为什么人工智能如此特殊呢?

方法学家的回答是:并不特殊。上下文适宜的回答是:它很复杂。

机器学习(ML)算法以人类无法处理的方式处理数据量。作为回报,它们需要大量的计算能力和真正优秀的数据。最终,ML 算法是复杂数学的计算实现。这意味着复杂数学的结果现在掌握在分析师用户手中。这一点,我认为,是有点特别的。

机器学习算法也能够超越其初衷的训练或用途,这是其他方法无法做到的。这就是机器学习中的“学习”,也是生成式人工智能中的“生成”。但我们现在在这类方法中看到的最引人注目的特性是语言生成。不管大型语言模型(LLM)的实际能力或理解程度如何,它都能用我们自己的语言进行表达。当某种东西以我们母语与我们对话时,这种经历本身就能激发信任。#拟人化没有任何其他方法能够用简单的英语与方法论者对话。

虽然这些因素确实使人工智能成为一个独特的科学领域,拥有一套独特的分析方法,但机器学习算法归根结底仍然是方法,并不适用于所有问题。在应用这些方法时,仍然需要一种方法论的思维,确保在合适的场景下应用这些方法,而在不适用的情况下采用其他方法。

关于方法

我们方法论者从各种方法中提炼出创意解决方案,跨行业应用。我曾经写过关于图分析实体解析的文章,前者是一种分析方法,后者则更偏向数据工程方法。还有传统的方法(例如,仿真、聚类分析、时间序列分析、情感分析)。当然,还有机器学习(监督学习、无监督学习和强化学习),以及一系列统计预测方法。还有认知思维策略(例如,观点采纳、角色扮演、竞争假设分析、多标准决策矩阵)以及更多面向实践的能力(例如,地理空间建模、生活模式分析、先进的数据可视化技术)。

尽管这些方法并不穷尽所有可能,但它们在不同行业中的应用方式有所不同。归根结底,它们就像乐高积木,供方法论者根据具体挑战组装成解决方案,帮助行业或企业应对各种问题。

那么,当面对迫在眉睫的截止日期时,我们如何将科学的严谨性和高保真度的方法论带入快速的技术解决方案中呢?

我们常常匆忙启动以数据为中心的工作。‘我们有这两个数据集,我们能从中学到什么?’虽然这是一个完全合理的关于数据的提问,但它不一定是一个科学探究和解决方案的最佳起点。

为了加速研究、快速原型开发和高质量的解决方案,贵组织需要采用以方法论为基础的思维方式,从问题出发,并以解决方案的第一原理为起点。没有方法论的指导,面对不断涌现的技术,我们所有人只是越走越快,却远离了问题的核心。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值