Assessing and Understanding Creativity in Large Language Models

828 篇文章

已下架不支持订阅

本文关注大型语言模型(LLM)的创造力评估,建立评估框架并使用Torrance测试进行多维度测量。研究发现LLM在独创性上不足,但在精细化方面表现出色,且模型的角色扮演和协作能提升独创性。同时,探讨了LLM与人类创造力的关联和人格特征的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Assessing and Understanding Creativity in Large Language Models》的翻译。

摘要

在自然语言处理领域,大型语言模型(LLM)的快速发展引起了越来越多的关注。LLM在各种任务中都表现出了很高的创造力,但评估这种创造力的方法还不够。LLM创造力的评估需要考虑与人类的差异,需要在平衡准确性和效率的同时进行多维测量。本文旨在建立一个有效的框架来评估LLM的创造力水平。通过调整修改后的Torrance创造性思维测试,该研究评估了各种LLM在7项任务中的创造性表现,强调了4个标准,包括流利性、灵活性、独创性和精细化。在这种情况下,我们开发了一个包含700个问题的综合数据集,用于测试和基于LLM的评估方法。此外,本研究还对LLM对不同提示和角色扮演情况的反应进行了新的分析。我们发现LLM的创造力主要在独创性方面不足,而在精细化方面表现出色。此外,提示的使用和模型的角色扮演设置显著影响创造力。此外,实验结果还表明,多个LLM之间的协作可以增强独创性。值得注意的是,我们的研究结果揭示了人类评价和LLM之间关于影响创造力的人格特征的共识。研究结果强调了LLM设计对创造力的重大影响,并将人工智能和人类创造力连接起来,为LLM的创造力和潜在应用提供了见解。

1 引言

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值