Identifying Multiple Personalities in Large Language Models with External Evaluation

本文探讨了使用外部评估方法分析大型语言模型(LLM)的人格,而非依赖自我评估测试。研究发现,LLM在不同情境下可以展示出不同的人格特征,与人类的稳定人格形成对比,强调了对LLM个性定义和测量方法的重新评估需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Identifying Multiple Personalities in Large Language Models
with External Evaluation》的翻译。

利用外部评价识别大型语言模型中的多重人格

摘要

随着大型语言模型(LLM)与人类日常应用程序的快速集成,人们对LLM的行为提出了许多社会和伦理问题。理解LLM行为的方法之一是分析他们的个性。最近的许多研究使用为人类创建的自我评估测试来量化LLM的个性。然而,许多批评质疑这些自我评估测试在应用于LLM时的适用性和可靠性。在本文中,我们使用另一种人格测量方法来研究LLM的人格,我们称之为外部评估方法,其中,我们不是用Likert量表中的多项选择题来提示LLM,而是通过使用外部机器学习模型分析LLM对开放式情境问题的反应来评估LLM的性格。我们首先微调了一个Llama2-7B模型作为MBTI人格预测因子,该模型作为分析LLM反应的工具,优于最先进的模型。然后,我们向LLM提示情境问题,并要求他们分别生成推特帖子和评论,以评估他们在扮演两个不同角色时的个性。使用外部人格评估方法,我们发现LLM在生成帖子和评论时获得的人格类型显著不同,而人类在这两种不同的情况下表现出一致的人格特征。这表明LLM可以在不同的场景中表现出不同的个性,从而突出了LLM和人类个性之间的根本区别。在我们的工作中,我们呼吁重新评估LLM中的人格定义和测量。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值