Language Models, Agent Models, and World Models: The LAW for Machine Reasoning and Planning

UnknownBody

已于 2024-03-08 11:27:12 修改

阅读量141

点赞数

CC 4.0 BY-SA版权

分类专栏： LLM Agent 文章标签：语言模型人工智能自然语言处理

于 2023-12-14 10:39:20 首次发布

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/134988342

LLM 日更同时被 2 个专栏收录

828 篇文章

已下架不支持订阅

LLM Agent

104 篇文章

订阅专栏

本文提出LAW框架，结合语言模型、代理模型和世界模型，以增强机器推理和规划能力。该框架引入信念、预期、目标及战略规划，旨在提供比现有语言模型更强大的推理。LAW利用语言模型作为后端，通过融合认知基础的模型解决多样化任务，同时也指出了框架的局限性和未来研究方向。

本文是LLM系列文章，针对《Language Models, Agent Models, and World Models: The LAW for Machine Reasoning and Planning》的翻译。

摘要

尽管大型语言模型在许多应用程序中取得了巨大成功，但由于其推理、学习和建模能力的固有局限性，它们在各种（语言、具体化和社会化）场景中往往无法实现一致的推理和规划。在这篇立场论文中，我们提出了机器推理的一个新视角，即LAW，它将语言模型、代理模型和世界模型的概念联系起来，以获得更强大和通用的推理能力。特别是，我们提出世界和代理人模型是推理的更好抽象，它引入了深思熟虑的类人推理的关键元素，包括对世界和其他代理人的信念、对后果的预期、目标/回报和战略规划。至关重要的是，LAW中的语言模型充当了实现系统或其元素的后端，从而提供了计算能力和适应性。我们回顾了最近取得相关进展的研究，并讨论了未来实施法律框架的研究方向。

1 引言

2 前言：三个模型

3 LAW框架

4 讨论

我们提出了LAW框架作为公式化机器推理的一个新视角。LAW融合了信念、未来预期、目标/回报和战略规划等关键要素，旨在实现比当前语言模型推理更强大、更通用的推理能力。LAW框架的各个方面与最近关于构建世界模型和代理模型的建议一致。至关重要的是，LAW引入了一个综合框架，以认知基础的方式将三个模型结合起来，以解决广泛的任务。我们已经讨论了现有的语言模型如何作为与世界和代理世界进行推理的后端。我们还提出了增强语言模型后端的世界和代理建模能力的可能方法，包括新的训练范式和增强多模态能力。
我们认识到法律框架有其局限性。首先，语言模型后端隐含了离散空间中的符号表示。我们已经讨论了用由其他模态建模的额外

了解本专栏