本文是LLM系列文章,针对《On the Decision-Making Abilities in Role-Playing using Large Language
Models 》的翻译。
摘要
大型语言模型(LLM)现在越来越多地用于角色扮演任务,尤其是在模拟特定领域的专家时,主要是通过角色扮演提示。当在现实世界场景中互动时,角色的决策能力会显著影响其行为模式。在本文中,我们专注于评估LLM角色扮演后的决策能力,从而验证角色扮演的有效性。我们的目标是为提高LLM在角色扮演任务中的决策能力提供指标和指导。具体而言,我们首先使用LLM来生成与Myers Briggs Type Indicator(缩写为MBTI)的16种人格类型相对应的虚拟角色描述,该16种性格类型表示人群的细分。然后,我们设计了具体的量化操作,从适应性、探索利用权衡能力、推理能力和安全性四个方面来评估LLM角色扮演后的决策能力。最后,我们通过GPT-4分析了决策性能与相应MBTI类型之间的关联。广泛的实验表明,不同角色的决策能力在四个方面存在稳定的差异,这表明决策能力与LLM模拟的角色之间存在强大的相关性。这些结果强调,LLM可以有效地扮演各种角色,同时体现其真正的社会学特征。
1 引言
2 相关工作
3 评估ChatGPT的决策能力
4 实验和分析
5 结论
本文旨在量化角色扮演后LLM的决策
本文关注大型语言模型(LLM)在角色扮演任务中的决策能力评估,通过MBTI人格类型创建虚拟角色,并从适应性、探索与利用、推理和安全性四个方面进行量化分析,结果显示决策能力与角色的关联性强,表明LLM能有效模拟各种角色并体现社会学特征。
已下架不支持订阅
774

被折叠的 条评论
为什么被折叠?



