本文是LLM系列文章,针对《In-Memory Learning: A Declarative Learning Framework for Large Language Models》的翻译。
摘要
探索代理是否可以在不依赖人类标记数据的情况下与环境保持一致是一个有趣的研究课题。我们从智能生物体中观察到的对齐过程中汲取灵感,提出了一个新的学习框架。在这个过程中,陈述性记忆在总结过去的经验中起着关键作用。智能体熟练地从过去的经验中学到见解,提炼和更新现有的笔记,以提高他们在环境中的表现。整个过程发生在记忆组件中,并通过自然语言实现,因此我们将此框架称为记忆内学习。我们还深入研究了旨在评估自我完善过程的基准测试的关键功能。通过系统的实验,我们展示了我们的框架的有效性,并提供了对这个问题的见解。
本文提出了一种新的学习框架——记忆内学习,受智能生物体的对齐过程启发,利用陈述性记忆来总结经验,提高在环境中的表现。通过实验,证明了该框架在大型语言模型自我完善的有效性。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



