本文是LLM系列文章,针对《Efficient Non-Parametric Uncertainty Quantification for Black-Box Large
Language Models and Decision Planning》的翻译。
摘要
使用大型语言模型(LLM)的逐步决策规划在人工智能代理开发中越来越受到关注。本文主要研究具有不确定性估计的决策规划,以解决语言模型中的幻觉问题。现有的方法要么是白盒方法,要么是计算要求很高的方法,限制了在预算内使用黑盒专有LLM。该论文的第一个贡献是LLM的非参数不确定性量化方法,该方法在不使用标记logits的情况下,通过单一推理有效地估计动态输入决策之间的逐点依赖性。该估计器为决策可信度的统计解释提供信息。第二个贡献概述了决策代理的系统设计,根据“洗澡”等用户提示生成“打开浴室灯”等动作。当多个操作具有较高的点依赖性时,用户将被要求提供偏好。总之,我们的不确定性估计和决策代理设计为人工智能代理开发提供了一种成本效益高的方法。
1 引言
2 相关工作
3 语言模型的有效非参数不确定性量化
4 决策代理
5 评估
6 结论
这项工作探索了人工智能代理在自然语言中根据人类请求做出决策的能力设计。它深入研究了决策中不确定性量化的挑战,并提出了一种对黑匣子大型语言模型使用

本文探讨了在人工智能代理开发中,使用大型语言模型(LLM)进行逐步决策规划的重要性。提出了一个非参数不确定性量化方法,用于估计黑盒LLM的动态输入决策间的依赖性,解决了幻觉问题。此外,还介绍了一个决策代理系统设计,用于根据用户提示生成相应动作。该方法提高了在有限资源下使用强大专有LLM的效率。
已下架不支持订阅
1668

被折叠的 条评论
为什么被折叠?



