人工智能需要从认知到理解:上下文难题以及知识表示中整洁的意义

本文的主要目的是探讨智能体如何在没有理想化、完美的理论索引的情况下,从技术层面处理和检索特定事件或主题的记忆。

我们有个语义时空项目,想法是讲故事是意向性和认知行为中所有难题的核心——甚至最终也是计算的核心,因为推理和在空间和时间中展开的最基本过程之间存在语义映射。

意识或许是知识的“难题”,或许不是,但语境无疑是其中之一!如果这听起来有些轻率,我可以补充一点,这两者之间的距离或许并没有你想象的那么遥远。但我们不应该操之过急!这篇文章并非关于意识。而是关于一个以关系形式呈现知识、造福人类的软件项目。

本文的主要目的是探讨智能体如何在没有理想化、完美的理论索引的情况下,从技术层面处理和检索特定事件或主题的记忆。我自己却发现这很难做到。我不擅长随机检索:人名、不相关的事实等等。另一方面,视觉或音乐提示可以让我立即识别。我可以从数百种颜色中,从一小片颜色中识别出一本书或一张黑胶唱片,因此我从来不需要按字母顺序排列书籍或唱片。既然我能唱出三岁时学会的整首歌,为什么记住简单的名字就这么难呢?答案似乎是缺乏背景。

知识到底是什么?

正如我之前多次说过的,知识并非我们日常生活中所描述的那样。它并非百科全书,并非可传播的商品。它并非你在书本或电脑里找到的东西。它并非莎士比亚的台词,也不是你仅仅记住的ABBA乐队的歌词。真正的知识只有当你像朋友一样熟悉时,才能存在于你的脑海中。

我们并不指望在电话簿中找到某人的名字后就能认识他,但有时我们假装通过快速浏览维基百科上的信息就能了解一些事情!

如果这让你想起了社会脑假说那就对了。能够以八卦的形式重复信息也不是知识:你需要能够自己讲述一个令人信服的故事,才能使其成为你的知识。硬盘或网络上的信息并非你的知识,而是一幅现代洞穴壁画。在书中,它仅仅是一个关于他人知识的故事。

知识的关键在于“工作”或努力。

在大学里,我们常说,复印一篇期刊论文就等于读过它。如今,在IT领域,我们对待知识的态度也大致如此。只要数据存储在某个地方以便将来访问,我们就认为自己“拥有”了它们,因此也就“了解”了它们。事实上,学习的过程更像是这样的:

  • 仔细查阅字典和事实目录以查找相关内容。
  • 询问其他知道在哪里可以找到信息的人。
  • 投资于相关事实和想法的文章和更长的阐述。
  • 阅读精选信息的书籍,以故事的形式讲述特定的概述。
  • 深入数据库和知识网络进行随机访问查找。

归根结底,知识就是你像朋友一样(随着时间的推移)学习了解的东西。它是一种足够深的熟悉,能够告诉你别人的习惯、缺点、某件事通常何时出现或不出现,以及如何利用或避免它。事物如何运作,以及我们如何认识它们,都与环境息息相关。如果你不努力去了解某件事,它对你来说就永远是个陌生人。

IT(信息技术)行业一直渴望通过委员会来标准化“足够好”的标准,却鲜有官方正式区分数据和知识。最接近的区分方式是将知识图谱定义为资源描述框架(Resource Description Framework)和Web本体语言(OWL)的W3C标准。这些XML时代的不成熟的标准(上世纪的产物)通常肤浅地渴望快速标准化可销售的工具——而这些工具却被一种无可救药的技术性官僚机构所取代,这些机构要求用户遵循却收效甚微。如果你喜欢记账或报税,你一定会喜欢这些标准。

这意味着,大多数将知识表示为信息网络的努力不仅在时间和精力上耗费巨大,而且最终的结果几乎毫无价值。当然,我们也将其中的乐趣官僚化,各种语言的类型系统和模式大多是在人们充分了解扩展挑战之前就设计出来的。没有什么比多条目记账更能让人忙碌了,但这一切都没有抓住重点。无论如何,IT 行业只是想把知识看作“数据库”的简称——毕竟,数据库才是可以出售的东西。大多数人觉得把知识称为讲故事有点儿轻率,因为我们觉得故事只是给小孩子听的,但叙事性阐述却是推理的核心——即使在形式逻辑中也是如此。我们应该重新思考。

我们如何管理知识:这是一个花园而不是仓库

我曾论证,事实陈述及其相互关系可以利用其“时空基础”得到更直观的表达。这究竟意味着什么?它指的是,我们感知周围时空事件的能力,以及理解周围时空事件的能力,无疑是我们所有认知和学习能力的根源。每一个高级概念最终都是建立在隐喻之上,隐喻之上,以及时空描述之上。这不仅仅是我个人的观点,之前也有人在语言学领域撰文论述过(例如,参见盖伊·德意志(Guy Deutsche )的著作)。

生命发展之初,没有网页或书籍可供阅读。眼睛、耳朵和认知大脑的进化,只能是为了对生物体周围的事物做出反应。我们现代的技能必定是从进化的副产品中汲取的,这些副产品包括:在海洋和森林中航行,记住我们把敲击棒放在哪里,哪种藤壶或猛犸象的皮毛最适合冬季穿着等等。换句话说,我们应该将所有推理视为在某个真实或虚构的时空中进行的导航。这无疑反映在语言的进化方式中(正如我在《智能时空》和《寻找确定性》中详细论述的那样)。

承诺理论确定了四种基本的时空关系类型。首先,我们应该停止思考“事物”,而应该思考“过程”。从这个角度来看,我们遇到的一切都是一种激情事件。一些具有认知能力的主体可以决定思考事件的四种基本方式:

  • 相似性——大致相同类型的事件
  • 导致——一个接一个的事件
  • 包含— 一个事件是另一个事件的一部分(同时)
  • 属性— 某物的属性或性质

在时空语言中,这些对应于等价/区别、时间结构或组成、空间组成以及可识别属性的空间表达。这些概念的起源可以在“语义时空”的著作中找到。

“人工智能”不会让这一切变得多余!

近年来,与知识相关的议题被所谓的“AI”(人工智能、人工智能提炼等,随便你怎么称呼)所主导。AI工具旨在将人类的思维处理工作剥离,代之以生成的响应。它们使用名为人工神经网络的复杂时空模型来实现这一点,这些模型是流水线式处理。它们生成优美流畅的语言输出,希望能引起读者的共鸣。然而,在这样做的同时,它们也把工作从读者手中夺走了。再说一次,即使信息正确,这种生成的输出也不是知识,因为它不是来自你的。在法庭上,它可能被称为传闻,因为你不是该叙述的目击者,也无法亲口证实。

与这种绕过人类认知的极端做法相反,我们能够也应该通过机器辅助人类管理知识过程来更好地理解知识过程:通过以一种既有意义又可自动化的方式呈现知识,来整理、记忆并增强逐渐消退的记忆能力。一个典型的学习过程可能是这样的:

  • 我们根据观察直接记录,或根据传闻间接记录。
  • 我们浏览笔记,并试图根据某种直观的模型将内容整理好,从而理解其中的含义。整理是简化和概括的重要方法——有时会与本体论混淆。
  • 随着时间的推移,我们会重新审视笔记并改变想法,进行编辑和修改——通常只是在脑海中进行,但在纸上或电脑上也会更加规范。
  • 最后,我们会与不同的听众一起回顾、修改和排练,将这些零散的片段转化为可以讲述故事的综合知识。这就是需要刻意努力去记忆的“肌肉记忆”。

至关重要的是,要明白不做功课,任何知识都无法转化为成果!知识就像一座花园,除非你悉心照料,否则它不会生长。档案馆是知识的坟墓,知识终将枯萎。保持知识的活力是一个持续的过程,收获的质量取决于你对它的呵护。此外,花园主要在你的脑海中——你的笔记只是一些秘书般的提醒。理解和回忆取决于你自己。你无法雇佣人工智能或机器人助手来照料你的大脑,就像机器人无法帮助你学习钢琴或跳高一样。它们或许能做得更好,但那并非你来之不易的理解。如果你试图作弊,你只会把自己排除在故事之外。

知识吸收的瓶颈在于大脑和我们感知的速度,所以,如果我们无法更快地吸收信息,“人工智能”能够更快地将信息传递给我们,这于事无补。如果结果是为我们而生的,它就需要花费尽可能多的时间。这应该告诉我们,人工智能在人类世界中的真正作用在于处理粗粒度、大规模影响的服务,而这些服务不需要人类的关注,而不是用来模仿人类创造力的花招。

知识策展的最后一步或许是理解某事。当我们能够讲述一个令人心满意足的故事时,我们便会说我们理解了它:一个足够令人满意的叙述,能够将我们收集到的零散断言串联起来。当我们的故事条理清晰,令我们自己满意且令人心满意足时,我们便会觉得自己理解了事情。每个人做出这一判断都有自己的门槛。通常,故事必须形成一个清晰的链条。为什么这应该成为我们的标准?答案或许是,因为当你需要穿越森林时,没有神奇的传送器,你必须自己走好每一步。至少现在还不行——这只能在以后通过社会知识和超越个人的合作来构建。但最终,这关乎讲述故事。

但为什么呢?解释一下!

“等等!”你会说,一个故事难道不应该是真实的才能被称为知识吗?我们别再胡扯这些“情感满足”的废话了!

理想情况下,答案当然是肯定的!如果我们能做出这样的判断就好了。但是,我们很少能够以任何无懈可击的方式确定真相。最终,我们只能接受那些值得信赖的假设。我们的情绪就像捷径,让我们避免陷入无休止的“但是为什么?!”的循环往复,让我们能够说:够了!它们为故事提供了可接受的最终状态。

为什么?告诉我为什么!

即使是我们尊崇的数理逻辑,也只能尝试将假设的点点滴滴串联起来。事实上,客观真理在大多数情况下或许只是一种虚幻的渴望——某种并不以可靠方式实际存在的东西。归根结底,它关乎我们选择信任或相信的事物版本。理解,或者说理清我们的故事,其过程如下:

我们根据所看到的事实创建故事情节。

当有人问,为什么……(该死)?然后我们扩展故事,添加一个令人满意的答案。

最终,我们被“为什么”弄得筋疲力尽,选择相信某个任意的起点被认为是正确的。我们称之为数学公理。即使在最严谨的科学中,这也是如此。

我们的“理解”就是我们在信息森林中找到的一条或多条路径。它正是我们能够讲述自己所知的故事。就像考试上说的:“用你自己的话”。

当然,人类讲述的最初故事可能是关于在哪里寻找食物,像蜜蜂和狼一样,如何回家,如何识别晚餐并避免成为晚餐。能够识别自然界中的模式和故事情节可能是语言和推理的起源。有趣的是,所有这些事情都起源于对时空事件的描述。

策略:从笔记到故事

这种观点的结果是,通过一种简单的计算机表示笔记和关系(N4L语言),我们可以将笔记转化为解释和恢复的过程。这种语言建立在勾勒出部分片段并将点连接起来的基础上。从这些点出发,人们可以用不同的算法组合故事——这要归功于我们对时空结构原理的了解。例如,假设我们正在尝试了解大脑。我们首先阅读或四处询问,然后记下一些看起来重要的笔记。

读书时即兴写下的一组粗略笔记可能是这样的……等等。在这种形式下,语言很容易转化为可搜索的结构,因为每个括号中的关系都必须映射到上述四种时空语义区别中的一种。难点在于:i)使注释准确且富有表现力;ii)确定这四种类型中的哪一种。学习需要几个小时,但这些指导原则让看似困难的建模变得相当容易。这就是为什么从长远来看,任何即兴的尝试都无济于事。获得正确的语义需要时间和精力。找到正确的关系并理解它们实际上属于哪四种类型,正是帮助我们理解的关键。

事件的时空结构始于此时此刻,并因果地扩展至未来相关事件的锥体。在物理学中,我们称之为“光锥”。

例子

在计算机编程中,我们以前很喜欢流程图。好吧,它看起来可能像这样。

传统的优秀流程图就是知识图谱的例子。

流程图是一种相当简单的图形,就像逻辑代数是一种相当简单的转换系统思维方式一样。上面的图在N4L语言中看起来是这样的:

上面的简单流程图的 N4L 表示。

这种提炼正是教师和作家在实践中所做的。这项工作并非人人都能轻松完成,但正因如此,软件才能在这一过程中提供辅助。我们可以想象,“人工智能”工具会帮助我们学习,而不是剥夺我们的学习。

空间和时间在认知中的作用

总而言之,一切都是事件,事件通过四种类型的箭头之一连接成故事。因此,连接这些点的箭头有很多名称,但它们都属于上述四类之一:

  • 相似性——等价程度
  • 导致——因果关系
  • 包含——一个事物是另一个事物的一部分吗?
  • PROPERTY — 节点的描述性或表达性属性

我们先来谈谈因果关系(导致性!),因为它是所有关于过程和变化的描述的基础。下图展示了一些因果箭头及其解释的示例。

因果关系有很多名称。这里仅列举几个。

因果箭头具有大致的传递性语义。如果 A 在 B 之前,B 在 C 之前,那么 A 也在 C 之前。因此它们具有一致的方向性。空间封装也可以采用类似的方法。我们不是“紧邻”,而是从观察者的角度思考“在……之内或之外”。包含也是一个传递性概念。

将任何空间和时间区域视为一个事件,我们可以通过其属性来描述该事件所表达的内容或所做的事情。这不是传递性的。

某些代理、某事物或某人的属性或特性。

最后,相似性和差异性的评估属于相似性的语义范畴。这通常是自然科学首先急于量化、度量化和过早推进的事情。即使在今天,从统计学到人工智能,大多数数学系统仍然使用某种人工空间中的勾股几何距离来测量相似性,而不是确定一个分离的标准。我们随意地将语义区分转化为连续统测量,以此作为计算方法。例如,“人工智能”就是这样做的。这导致了阈值模糊。

相似性或等价性的问题是一个微妙的问题,我们在科学中过度使用了它。

简而言之,这就是时空方法。希望你能明白……我们怎么知道该如何标记箭头?也许我们不知道,但这种决心也是旅程的一部分。只要有一点经验,学习起来并不难。

例如:归属

有些关系可能难以理解。例如,所有权的语义就并非完全明确。假设你想说:

手镯“属于”马丁。

手镯是马丁的财产还是他的一部分?作为一个对象,我们可以选择将其作为“马丁的扩展空间”的一部分。没有正确答案。你可以在特定情境下选择适合你的方式。两者之间的实际区别在于,它们最终是如何被搜索的,是作为过程的一部分。同样,我们被教导要从“事物”的角度思考,而实际上我们应该思考的是过程。

如果我们把手镯解释为马丁的“一部分”,那么我们也可以说手镯里有一颗钻石,因此钻石也是马丁的一部分,因为“一部分”是及物关系。但如果我们说手镯只是马丁的一个特征,那么这显然不是及物关系,因为手镯的特征可能是金色的,但这并不意味着马丁也是金色的!

你可能一开始会做出错误的选择,但改变决定很容易,因为关系的定义独立于你使用它的所有数据。你会在过程中发现措辞中的错误,而这种重新思考正是学习的过程。

现在语言界面的用处就显而易见了。编辑笔记比维护数据库容易得多。

80/20 分割?背景!

到目前为止,这已经足够简单了,即使并非完全容易。但我们仍然没有解决一个难题:如何确定我们收集到的信息的相关性。我们可以很容易地把它变成一张巨大的网络,但这张网络从哪里开始,又在哪里结束?除了暴力文本搜索之外,我们如何才能找到与我们记录的内容相关的其他事物?

现代计算的趋势是追求“大数据”——不断获取越来越多的证据来找到正确的答案。但这与我们情绪大脑的做法截然相反。大数据爱好者们认为,与其通过粗粒度的近似(少即是多)来尽快结束辛劳,不如多多益善。不惜一切代价!

在这里,我们寻求的是大数据的反面。我们希望数据廉价、精简且相关。讽刺的是,这意味着确定知识相关性的语境必须大于关键知识信息本身。该项目的一项发现,正如承诺理论所预测的那样,知识似乎受制于对其相关性的探索。这有助于解释为什么现代“人工智能”方法也迅速变得如此昂贵。大部分数据和计算成本实际上与语境化有关。这其中蕴含着关于推理本质的教训,而这一教训在继承下来的逻辑叙述中被掩盖了:科学在其提炼原理的策略中寻求“适当理想化的简化”。这最终引发了与知识本身广博性的冲突,但它概括了人类的方法。我们寻求的是能够引起情感共鸣的总结,相信细节可以在社会层面上得到扩展和验证,作为更大过程的一部分。这就是知识的扩展。

我们以多种方式使用“上下文”一词。

策略性索引上下文*:做笔记时,我们会用标题和标题来描述“关于性”的上下文:关键词,也许是一个短语,用来描述我们将在文章中找到的内容。这是一种策略性地使用上下文。它意味着:我的策略是把这个放在这里,这样如果你查找这些关键词,就能找到它。或者,当我以后搜索这个内容时,我会查找哪个索引项。

场景描述:得益于我们的感官,我们思考某事的语境可能取决于一系列复杂的事件(包括归属感和因果关系),这些事件最终被概括为场景状态的快照,我们称之为语境。因此,对语境的最完整描述只是当下的背景故事。想象一下法医调查员如何破案。他们将语境整合为事实描述、因果动机以及上述所有因素如何交织在一起。

作为我们当前的精神状态:对我们周围发生的事情的短期记忆缓存,跟踪相关性。

我们目前的意图。

我们或许会设想一种场景描述语言(Scene Description Language,SCL)作为描述语境的最终目标。但仔细思考后,我们会意识到,这种想象中的场景描述语言只是我们在N4L框架下开发的语义时空的一种形式。它并非一个完全不同的东西,只是同一模型的不同部分。一个区域与另一个区域相连。语境的区别在于它的使用方式。例如:

马丁在场。他认识莎莉,来帮她搬一箱很重的酒。因为酒太重,他把酒放在桌子上,结果桌子塌了,打碎了一瓶氨水。氨水导致几个人呼吸困难,其中一人心脏病发作……

这种描述,引向某个关键事件,需要所有时空类别的表征:什么接着什么发生,什么在哪个地方,物品有哪些属性,哪些人靠得很近,等等?从关于死亡或谋杀的本体论的角度来看,所有这些都与人们可能在该标题下写的任何内容相去甚远。在本体论中,人们可能会写:刺伤、枪击等,与搬运酒箱无关。因此在实践中,构成谋杀背景的细节可能是完全不相关的附加物,在知识图谱中显得很遥远。然而,当我们听到它们时,它们会引发与谋杀的联想。就像披萨的建议可能会通过与黑道家族某一集的联系引发谋杀一样。我们的思维不是整洁或合乎逻辑的,而是具有联想性的。

犯罪现场的大规模知识结构可能涉及许多原本来自不同情境的独立区域。新的情境如何在当前情境下将这些区域连接起来?

但语境更多的是关于场景描述。比如,想想你最喜欢的电视剧里的任何法医调查(比如《犯罪现场调查》、《无声证人》、《阿加莎·克里斯蒂》等等)。

在 IT 知识系统中,形式“本体”的概念在研究人员中非常流行,并被转化为像OWL这样的简单逻辑。这种想法认为知识存在一种由正确的分类含义组成的生成树,这是 IT 领域简单思维的一部分。不幸的是,这种想法已被多次证明是有缺陷的,甚至完全是错误的。分类法和本体仅仅是用于命名网络区域的生成集。是的,它们试图将事物放入盒子中以保持整洁。但这些盒子并不互相排斥,鸭嘴兽是哺乳动物还是卵生动物?。将完整的逻辑强加于不完整的知识充其量是一种糟糕的组织策略。

生成树或称对意义进行分类的解释总是有很多种可能的。我们讲述一个故事时,可能从头开始,按照时间顺序进行,也可能从结果开始,然后倒叙。我们可能会在时间维度上来回跳跃,以讨论各个部分与整体的关联性。上下文并非生成树。

通过追寻思维的轨迹,我们正在构建一系列先决条件,以便我们进化而来用于在景观中导航的大脑能够理解。如果我们沉迷于完美逻辑的自负,就会倾向于过度限制信息,以至于如果没有用于存储信息的精确标准,就无法找到信息。这可能是在使用 RDF 和 OWL(网络本体语言)等工具时最常见的错误,因为它们基于一阶逻辑。逻辑最终会对我们不利,因为我们需要重现精确的查找关键字才能找到我们要找的东西——而我们甚至可能并不清楚自己在寻找什么!记忆的主要好处在于通过“混合”来创造性地组合想法。

突发推理:没有快速解决方案

在试图写下来的时候,我们很难想象在一个语境中想要表达的一系列关系。想象一下,在某件事发生后,试图写一份警方声明。你可能会试图将细节的描述引向一些引导性文字,而不是简单地描述你所知道的内容,因为你目前还不明白这些细节与结果之间的关系。回想起来,情况就不同了。通过梳理笔记并反复修改,用程序员的话来说,就是重构代码,我们逐渐完善了一个更清晰的故事,用象征性的动作和事件来讲述一个令人愉悦的故事。

让我们明确一点,一个令人愉悦的故事是情感上令人愉悦的故事,而不是代数上正确的故事。最终形成的语言会变成一种关注点类似的专业语言。动机、手段、罪犯、受害者等等。人们通过对信息进行极端处理来提取模式,提炼其精髓。随着时间的推移,这有助于压缩信息,使其更容易以语言的形式传递。

其他过程包括法庭上的证据推理,最终由一位值得信赖的法官进行情感解读;或者在研究期刊上讲述关于某一现象的许多不同故事,称为理论或模型,最终由同行评议选出。进化的原理是依靠混乱环境中的统计持久性。这些都是有效的过程模型,但如果我们试图将特定场景强行塞入不合适的过程中,就像计算机程序员有时处理数据模型那样,很容易陷入死胡同。

用 N4L 方法处理谋杀现场

知识包含许多不同层面的元素,我们试图将它们串联起来。从感知世界的信息中,我们提取数据,并将其嵌入到故事中。

总结

知识表征的尴尬之处在于它并非干净整洁。我们追求的那种整洁需要大量的工作才能提炼成一种专门的语言。因此,语言而非逻辑是总结和重构知识的关键——通过整理、重构、遗忘和有意删除事实,我们才能得出一个连贯的故事。

无论口头还是书面,通过粗粒度处理和精简参考点,将事件提炼成符号流,都是一种记忆管理算法。我们这些为了理解而写作的人,学会将此作为一个过程甚至是一项工作!。教师和教育工作者也擅长撰写故事或线索,以引起共鸣的方式传达思想。知识具有社会层面。我们倾向于认为知识只存在于我们自身,但实际上,它的踪迹和线索就在我们身边。我们所依赖的大部分记忆都存在于我们的大脑之外,因为我们受到地点、道路、事物和过程的引导。

从这个意义上来说,对意义的探索是一种经典的根本原因探索,从最底层的症状到涵盖所有后续事件的某种高层次的母系事件。

我们学习的方式是自下而上,但沟通方式通常是自上而下的。我们首先泛泛而谈,作为一种经济策略,希望避免解释细节,但同时也相信在必要时可以补充。语言毕竟是一维的符号流,概括了一段复杂历史的时间线。然而,我们擅长仅凭叙述来构建一幅图景。这并不像我们想象的那么容易,如果没有仔细分析,事情的真相就会被扭曲,然而,语言却能够有效地激发他人的共鸣和理解。

当我们想要回忆的时候,困难就来了。我们从哪里开始?我们从网络的哪个部分开始进入故事?很可能有很多可能性同时被激活,直到我们最终确定一个。我们的意识有一个注意力机制,每次给我们提供一个故事,也许患有多重人格障碍的人除外?也许这就是意识体验的起源——作为理解记忆和经验的必要时间线公式。

总而言之,或许,理解事物最深刻、最困难的部分,就在于背景所扮演的角色:历史环境构成的网络,它阐明了我们周围发生的诸多变化,并将我们记忆中的每个时刻进行分类,以便我们在未来能够利用这些信息。知识从根本上来说是可操作的。这不应该让我们感到惊讶:毕竟,我们拥有先进心智能力的最可能原因,肯定源于动物王国所需的技能,例如在地形中导航以及识别敌友和食物。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值