常识推理的逻辑与挑战
1. 常识推理中的逻辑能力
在常识推理中,有一种观点认为智能体应具备强大的逻辑推理能力,能够从命题 P 推导出其蕴含的任何结论,哲学家 Jaakko Hintikka 将此称为逻辑全知。但实际上,智能体通常需从世界模型而非单纯的公式 P 开始推理。若智能体能从世界模型得出 P,那么它也能从同一模型得出 Q。不过,我们并不要求常识智能体一定能察觉 P 到 Q 的逻辑联系。
2. 推理操作的复杂性与局限性
2.1 TEST 操作的计算难题
TEST 操作在某些情况下可能对常识应用而言要求过高。例如,当使用 TEST 确定一个涉及五个变量的 “存在” 公式是否为真时,若世界模型中有 1000 个常量,TEST 可能需查看多达 $10^{15}$ 种不同组合,即便每秒能考虑十亿种组合,也需十多天才能遍历完。
不过,存在一些缓解因素:
- 很少需要找出像这样五个相互关联事物的组合,通常是成对或成三地寻找。
- TEST 可采用自下而上的增量计算方式,避免穷举所有组合。例如,对于公式 “Person:x has Person:y as a friend”,只需考虑世界模型中具有朋友关系的 Person:x 和 Person:y 的值,而非所有 $10^6$ 种组合。若公式中还有其他仅使用这两个变量的合取项,组合数量还可进一步减少。
2.2 递归带来的问题
TEST 在处理递归时也存在问题。虽然能让 TEST 在模型中查找亲子关系链,但这是一个强大的操作,不能保证 TEST 总能停止扩展递归定义并得出最终答案。不过,在常识推理中,递归的使用通常有限,如用于传递闭包(从父母到祖先),有专门的机制来处理此类情况。
2.3 数字和序列的处理
对于数字,可修改 TEST 使其能识别无变量的算术公式,如 “2*3 < 5+4”。但不应期望 TEST 在常识推理中能评估含变量的算术公式。例如,对于公式 “6 < Number:x”,FIND - ALL 操作只会返回模型中实际出现的大于 6 的有限个数值常量,而非所有大于 6 的无限个数字。
在序列方面,FIND - ALL 操作不能用于定位实现某个目标的动作序列,除非模型中有代表这些序列的常量。世界模型中通常是过去已证明有用的动作表示,对于非原始动作,会与一系列原始动作相关联,FIND - ALL 操作可用于查找这些记忆中的动作序列以用于规划,这种更有限的规划概念更适合常识推理,而从基本原理组装全新动作序列的任务则适合谜题模式推理。
以下是一个简单的流程图,展示 TEST 操作在处理公式时的大致流程:
graph TD;
A[开始] --> B[输入公式和世界模型];
B --> C{公式是否含多个变量};
C -- 是 --> D[考虑变量组合情况];
C -- 否 --> E[直接判断公式真假];
D --> F{是否为递归公式};
F -- 是 --> G[检查递归处理机制];
F -- 否 --> H[按常规组合计算];
G --> I{是否能停止递归};
I -- 是 --> J[得出结果];
I -- 否 --> K[可能陷入无限循环];
H --> J;
E --> J;
J --> L[结束];
K --> M[需人工干预或调整];
3. 知识表示的问题
3.1 不完整知识的挑战
提出基本知识用世界模型表示,公式表达的信念从世界模型推导得出,但对于不完整知识的处理仍是问题。例如,在阅读一本悬疑小说时,已知谋杀案凶手是三个嫌疑人之一,最初用包含三个代表嫌疑人常量的世界模型,但当发现其中一人是凶手时,这种表示方式就会失效。
在这种情况下,可在模型中使用第四个常量代表凶手,以表示关于凶手的信息并进行推理,但这会带来新问题。不能再假设每个公式都能简单判断真假,例如 “Person#92 is UnknownPerson#17” 不能仅因两个常量不同就判定为假,TEST 操作需要改变。
3.2 其他形式的不完整知识
另一种不完整知识如后院有一些狗且都属于 Jim,但不知道狗的数量。若知道有四只狗,可构建包含四只狗表示的模型,但不知道数量时,就难以处理。类似的情况还有 “All the paint cans in John’s basement are covered in dust” 以及 “All the stars in the Milky Way galaxy are bigger than Neptune” 等表述。
以下是一个表格总结不同形式不完整知识的处理难点:
| 不完整知识形式 | 示例 | 处理难点 |
| ---- | ---- | ---- |
| 特定对象身份不明 | 悬疑小说中凶手身份未知 | 现有世界模型表示方式失效,TEST 操作需改变 |
| 数量信息缺失 | 后院狗的数量未知 | 难以构建合适的世界模型来表示知识 |
4. 应对不完整知识的可能方案
4.1 Johnson - Laird 模型
Johnson - Laird 提出一种与世界模型类似但有更多附加特征的表示方法,其模型包含代表可能存在或不存在的假设对象的符号。例如,用一定数量的符号代表后院的狗,都标记为属于 Jim,还有一些代表 Jim 拥有的非后院狗的对象。该方法从推理角度有吸引力,但作为通用表示机制还需进一步研究,例如如何避免从这些模型得出关于实际存在或不存在事物的错误结论。
4.2 允许通用公式但进行浅层推理
另一种方案是允许任意通用公式成为知识库的一部分,但只从中得出某些浅层结论,这些结论不足以解决难题,但易于计算。当知识库清晰时,浅层推理可能与 TEST 操作一致。例如,知识库中有 “All the dogs in the backyard are owned by Jim” 时,能得出 “所有后院的棕色狗都属于 Jim” 等明显结论,但可能无法与其他事实结合得出更复杂的结论,此方案也需进一步研究。
5. 研究方向与致谢
人工智能知识表示和推理领域的大量研究致力于在逻辑和概率推理的海洋中寻找其他 “可处理性岛屿”,即寻找从逻辑和概率角度有意义且能在大型符号知识表示上高效自动执行的推理形式,这与理论计算机科学中计算复杂性领域理解计算任务难易的研究相契合。
最后,感谢在研究过程中给予帮助的人。受到 Gary Marcus、Ernest Davis、Melanie Mitchell 等人著作的启发开展此项目,他们还对早期草稿提出了有益建议。也感谢 Gerhard Lakemeyer、Gregg Vesonder 和三位匿名审稿人的意见,以及 Bruce Brachman 的精彩插图。感谢 MIT Press 的工作人员,特别是 Alex Hoopes、Elizabeth Swayze 和编辑 Virginia Crossman。同时,感谢家人在写作过程中的支持和耐心。
6. 常识推理的总结与展望
6.1 常识推理的核心要点
常识推理在逻辑能力、推理操作和知识表示等方面都面临着诸多挑战。从逻辑能力上看,智能体虽不需要具备绝对的逻辑全知,但要能基于世界模型进行合理推导。推理操作中,TEST 和 FIND - ALL 等操作在处理复杂情况时存在计算难题,如变量组合过多、递归无法停止等问题,但也有相应的缓解策略。在知识表示方面,不完整知识的处理是一大难点,不同形式的不完整知识需要不同的应对方案。
以下是对常识推理核心要点的总结列表:
-
逻辑能力
:基于世界模型推理,不要求察觉所有逻辑联系。
-
推理操作
:
- TEST 操作在复杂变量组合时计算量大,有缓解因素。
- 递归处理可能陷入无限循环,常识应用中使用有限。
- 数字和序列处理有局限性,遵循模型中常量原则。
-
知识表示
:不完整知识处理困难,有不同形式及对应难点。
6.2 未来研究的重点方向
未来的研究应着重解决现有方案中的问题。对于 Johnson - Laird 模型,需要深入研究如何避免得出错误结论,完善其作为通用表示机制的能力。对于允许通用公式进行浅层推理的方案,要探索如何更好地结合不同事实得出更有深度的结论。同时,继续在逻辑和概率推理中寻找更多 “可处理性岛屿”,提高常识推理的效率和准确性。
以下是未来研究重点方向的流程图:
graph LR;
A[研究 Johnson - Laird 模型] --> B[避免错误结论];
A --> C[完善通用表示能力];
D[浅层推理方案研究] --> E[结合不同事实];
D --> F[得出更有深度结论];
G[寻找可处理性岛屿] --> H[提高推理效率];
G --> I[提高推理准确性];
7. 研究的意义与价值
7.1 对人工智能发展的推动
常识推理的研究对于人工智能的发展具有重要意义。在实际应用中,人工智能系统需要具备常识推理能力才能更好地理解和处理复杂的现实情况。例如,在智能客服、智能助手等领域,能够基于常识进行推理可以提高系统的响应准确性和用户体验。
7.2 与其他领域的交叉融合
常识推理的研究还与其他领域存在交叉融合。与理论计算机科学中计算复杂性的研究相结合,有助于理解计算任务的难易程度,从而优化推理算法。同时,在自然语言处理、机器学习等领域,常识推理也可以为模型提供更丰富的语义信息,提高模型的性能。
以下是常识推理研究意义的表格总结:
| 意义方面 | 具体内容 |
| ---- | ---- |
| 对人工智能发展 | 推动实际应用,提高系统响应准确性和用户体验 |
| 与其他领域交叉融合 | 结合计算复杂性研究优化算法,为其他领域提供语义信息 |
8. 结语
常识推理是一个充满挑战但又极具潜力的研究领域。虽然目前在逻辑能力、推理操作和知识表示等方面存在诸多问题,但通过不断的研究和探索,我们有望找到更好的解决方案。未来的研究需要综合考虑各种因素,结合不同的方法和技术,逐步提高常识推理的能力和水平,为人工智能的发展和应用带来更多的可能性。同时,也感谢所有在研究过程中给予支持和帮助的人,他们的贡献使得我们能够在这个领域不断前进。
超级会员免费看

被折叠的 条评论
为什么被折叠?



