基于因果关系模型的累积学习
在追求通用人工智能(AGI)的道路上,我们面临着诸多挑战,其中之一便是确定何种表示方式能够赋予智能体在复杂物理环境中所需的灵活性。目前,持续学习多领域知识的能力尚未完全实现,而通过连续累积学习来提升通用性能的有效方案也较为匮乏。本文将介绍一种累积学习机制,该机制能够构建环境的因果关系模型,以预测事件并实现目标。
1. 引言
我们将自然界中智能的存在视为应对有限时间和资源的实用解决方案,因此致力于寻找构建通用人工智能系统的可行方法。本文主要聚焦于累积建模的理论方面,而其更大的背景是能够应对物理世界复杂性的通用人工智能系统。
1.1 环境与领域
一个目标导向的智能体所处的环境 E 可被视为由一组变量 V 组成,这些变量代表了世界中可能具有特定值并随时间变化的事物。变量之间存在各种关系 ℜ(如因果关系、气象关系等),以及动态函数 F,它们共同决定了这些变化的发生方式。环境 E 的子集可以被识别出来,这些子集代表了我们所说的领域 D。
1.2 累积建模与目标
根据 Conant 和 Ashby 的良好调节器定理,一个学习型智能体若要在复杂世界中高效生存,必须对其任务环境进行建模。因此,任何通用人工智能系统都需要大量的模型来在物理世界中有效运行。累积建模器 CM 是一种控制器,它在一个或多个顶层目标 Gtop 的引导下,从环境 E 中递归提取规律,构建环境的模型 MD,以实现预测和目标达成的目的。
1.3 双向模型与知识特性
智能体创建的模型是双向的,既能用于预测事件,又能用于实现目标。当模型被触发时,其在这两方面的实用性都会得到测试和评估。模型能够形
超级会员免费看
订阅专栏 解锁全文
685

被折叠的 条评论
为什么被折叠?



