人工智能系统中的有意遗忘:视角与挑战
1. 引言
如今,企业面临着数字数据和信息的海量增长。像大数据这样的技术趋势,聚焦于数据的聚合、关联和相关性分析,以此应对决策过程中的信息过载问题。从心理学角度看,人类通过选择性遗忘知识来应对信息过载。遗忘可定义为在特定情境下,先前已知的某条信息无法获取,它是一种适应性功能,用于删除、覆盖、抑制或筛选过时信息。
在计算机科学领域,遗忘的需求早已被认识到。逻辑领域提出了无上下文遗忘算子,逻辑遗忘会明确修改知识库(KB);而机器学习方法则通过对输入数据进行抽象,隐式地遗忘细节,还能通过聚合知识来降低复杂度;分布式人工智能(DAI)则通过在代理之间分配知识来降低复杂度,单个代理“遗忘”,但整个系统通过交互“记住”。
人类的遗忘也是一种有意机制,有助于聚焦相关知识以支持决策。因此,我们需要思考人类何时以及如何有意遗忘,以及智能系统应何时和如何执行遗忘功能。“组织中的有意遗忘”这一优先研究项目应运而生,计算机科学和心理学领域的研究人员在八个合作项目中,跨学科地研究人工智能系统中有意遗忘的不同方面。
2. 知识表示与认知:FADE
FADE(通过激活、减少和消除进行遗忘)项目旨在整合认知科学和计算机科学的方法,支持信息流中信息的预选和聚合,减轻用户的工作量。该项目分析组织中的知识结构以及认知架构中人类记忆结构的数学和心理学建模方法,设计能够压缩和减少数据量的优先级和遗忘功能。同时,开发一个认知计算系统,用于遗忘操作,使系统模型参数可系统地确定和调整,并对每个知识结构透明化。
遗忘虽在日常生活中常被视为负面行为,但它能有效帮助人类聚焦更相关的信息。认知遗忘过程的关键特征包括信息不会丢失,而是具有激活水平,信息的相关性取决于其与其他信息的连接以及过去的使用情况。此外,不同的信息特征需要不同形式的遗忘,知识表示和推理的见解有助于细化声明性知识,区分断言性知识和概念性知识。
FADE项目专注于能够模拟遗忘的认知和主观方面的形式化方法,非单调推理和信念修正的各种形式主义对此非常有帮助。挑战在于将这些方法调整为模拟人类遗忘,并使其在组织环境中可用。进一步的目标是将这些调整后的形式化方法集成到认知架构中,为遗忘操作提供形式化的认知框架。
3. 本体与推理:EVOWIPE
新产品通常通过修改现有产品模型来开发。EVOWIPE项目旨在支持产品开发者在知识库中有意遗忘与新产品不适用的方面。例如,大众e - Golf的产品模型大部分基于大众燃油高尔夫,但需要对原产品模型进行更改、添加和遗忘操作,如连接发动机、添加电池温度控制系统以及遗忘燃油箱、燃油管路和废气处理系统。
EVOWIPE项目开发了一系列有意遗忘的操作符,包括遗忘推理知识、恢复已遗忘元素、临时遗忘、在遗忘中表示占位符以及级联遗忘。这些操作符与知识表示中的删除操作符有相似之处。项目将现有产品模型数据结构转换为基于OWL的表示,并利用SPARQL更新查询访问知识库,这些查询不仅可以删除知识,还可以插入新知识,因此项目也研究了删除和插入操作的相互作用。
为了实现级联遗忘,需要指定知识库中的依赖关系,可将其作为元属性添加到知识库中。目前,项目团队正在研究从产品模型中自动提取依赖关系的方法。通过开发这些操作符,EVOWIPE项目将产品开发过程扩展到包括严格的有意遗忘方法,帮助产品开发者应对产品模型、开发过程和遗忘过程中的复杂性。
4. 机器学习:Dare2Del
Dare2Del是一个上下文感知的认知伴侣系统,旨在支持对数字对象的遗忘。该系统帮助用户删除或存档被分类为无关的数字对象,并通过隐藏与当前任务无关的数字信息,支持用户专注于当前任务。与心理学领域合作,研究在哪些人员和情况下,信息隐藏可以提高任务绩效,以及如何通过解释建立用户对系统决策的信任。
Dare2Del基于归纳逻辑编程(ILP),这是一种基于Prolog的白盒机器学习方法。ILP允许从少量训练数据中学习,自然地结合推理和学习,并能融入背景知识,还能提供人类可理解的分类器。
为了成为有效的认知伴侣,Dare2Del需要能够向用户解释系统决策,并具有适应性。目前正在设计ILP的增量变体以实现交互式学习,系统会考虑用户给出的解释。例如,如果用户决定不删除某个对象,可以选择与该对象相关的一个或多个谓词作为不删除的原因,Dare2Del会相应地调整其模型。
Dare2Del的应用场景包括行政管理和工业互联。在行政管理中,帮助用户删除无关文件,隐藏表格中的无关列;在工业互联中,支持质量工程师识别无关测量和数据进行删除或隐藏。
5. 自组织:Managed Forgetting
研究在基层(即分散和自组织)组织记忆中的有意遗忘,提出了基于证据的有意遗忘形式——Managed Forgetting(MF)。在MF中,无需明确的意愿,根据观察到的证据,以自组织和分散的方式学习遗忘什么和关注什么。
MF有两种形式:
-
记忆浮力
:增强遗忘性信息访问。记忆浮力(MB)表示信息项对用户的当前价值,不太相关的信息项会“沉下去”,而重要的信息项会更接近用户。MB值的计算基于多种证据(如用户活动)、激活传播和启发式方法,为遗忘性访问方法(如隐藏、压缩、自适应同步和删除以及遗忘性搜索)提供基础。
-
基于上下文的抑制
:便于上下文切换。知识工作者经常需要进行上下文切换,与MB的渐进变化不同,上下文切换时的变化更为突然。因此,可以采用基于抑制概念的方法,暂时隐藏其他上下文的资源,实现自我整理和自我组织的上下文空间。
MF应用于语义桌面,它基于个人信息模型(PIMO)以机器可理解的方式语义链接信息项,个人PIMO的共享部分构成组织记忆的基础。
以下是相关项目的简单对比表格:
|项目名称|研究重点|应用场景|
| ---- | ---- | ---- |
|FADE|整合认知与计算机科学方法,模拟人类遗忘|组织知识管理|
|EVOWIPE|开发产品模型知识库的遗忘操作符|产品开发|
|Dare2Del|基于ILP的数字对象遗忘系统|行政管理、工业互联|
|Managed Forgetting|自组织的有意遗忘|基层组织记忆管理|
下面是一个简单的mermaid流程图,展示信息过载下不同遗忘方式的关系:
graph LR
A[信息过载] --> B[逻辑遗忘]
A --> C[机器学习遗忘]
A --> D[分布式AI遗忘]
B --> E[修改知识库]
C --> F[聚合知识]
D --> G[代理间知识分配]
6. 分布式人工智能:AdaptPRO
在分布式人工智能(DAI)中,智能代理封装了与领域、任务和行动紧密相关的知识。这些代理能够感知环境、对变化做出反应,并通过社交协商自主行动。遗忘在DAI中虽然是一个隐含的研究主题,例如信念修正和可能世界语义学,但从团队视角来看,知识分布、角色和流程的改变尚未得到充分分析。
AdaptPRO项目聚焦于这些方面,借鉴心理学中团队的有意遗忘概念,将有意遗忘定义为团队中知识的重组。团队认知(TC)描述了知识在团队成员脑海中的表示、分布和预期方式,以执行行动。这个概念也可用于建模代理系统中的知识分布。
在知识分布方面,角色和流程的组织通过分配、共享或划分知识来实现。当某些团队成员专注于特定领域时,其他代理可以忽略相关信息。在合作过程中,代理之间共享与任务和团队相关的知识非常重要,特别是在出现干扰时,冗余知识和任务能力有助于实现稳健的团队合作。
为了在共享和划分知识之间取得平衡,即实现高效和稳健的团队合作,AdaptPRO采用跨学科方法,对团队中的知识结构进行建模、分析和调整,并衡量其对个体和团队视角的影响。
7. 挑战与未来机遇
上述不同视角下的有意遗忘研究,为人工智能系统带来了诸多机遇:
-
建立跨学科指南
:通过将认知和组织与正式的人工智能方法相结合,为组织实现类似人类的遗忘提供指导。
-
应对信息过载
:通过临时遗忘和恢复知识,处理推理和级联知识结构中的信息过载问题。
-
支持人类决策
:利用全面的知识管理和机器学习,遗忘数字对象,辅助人类决策。
-
助力组织知识管理
:通过自组织和自我整理,支持组织的知识管理。
-
调整组织流程和角色
:通过重组知识分布,调整组织中的流程和角色。
然而,要实现这些机遇,还需要克服以下挑战:
1.
统一术语
:统一人工智能中(有意)遗忘的概念术语。
2.
知识和遗忘形式化
:对知识和遗忘的类型进行形式化,使遗忘操作的前提和目标透明化,并研究其形式属性。
3.
不同知识的遗忘技术
:研究不同形式的知识是否需要不同的遗忘技术。
4.
高效记忆
:实现知识的高效记忆。
5.
临时遗忘
:开发从知识库中临时遗忘信息的方法。
6.
增量概率方法
:开发归纳逻辑编程的增量概率方法,实现通过相互解释进行交互式学习。
7.
生成解释
:以口头理由、示例或反例的形式生成有用的解释。
8.
正确解读用户信息
:正确解读用户活动、工作环境和信息,以启动适当的遗忘措施。
9.
团队知识表征与操作
:表征团队和DAI系统中的知识,开发用于重新分配、扩展和遗忘信息的正式操作符。
以下是机遇与挑战的对应表格:
|机遇|对应挑战|
| ---- | ---- |
|建立跨学科指南|统一术语、知识和遗忘形式化|
|应对信息过载|不同知识的遗忘技术、临时遗忘|
|支持人类决策|增量概率方法、生成解释|
|助力组织知识管理|正确解读用户信息|
|调整组织流程和角色|团队知识表征与操作|
下面是一个mermaid流程图,展示挑战与机遇的关系:
graph LR
A[机遇] --> B[建立跨学科指南]
A --> C[应对信息过载]
A --> D[支持人类决策]
A --> E[助力组织知识管理]
A --> F[调整组织流程和角色]
B --> G[统一术语]
B --> H[知识和遗忘形式化]
C --> I[不同知识的遗忘技术]
C --> J[临时遗忘]
D --> K[增量概率方法]
D --> L[生成解释]
E --> M[正确解读用户信息]
F --> N[团队知识表征与操作]
有意遗忘的研究为人工智能系统应对当今的复杂性和数据可用性提供了新的方向。克服上述挑战将为未来人工智能研究奠定重要基础,有意遗忘有望成为下一代人工智能系统的必备功能。
超级会员免费看
541

被折叠的 条评论
为什么被折叠?



