本文是LLM系列文章,针对《Prevalence and prevention of large language model use in crowd work》的翻译。
众包工作中使用大型语言模型的流行率和预防
摘要
我们表明,大型语言模型(LLM)的使用在众包工作者中很普遍,有针对性的缓解策略可以显著减少但不能消除LLM的使用。在文本摘要任务中,没有以任何方式指导工人使用LLM,LLM使用的估计流行率约为30%,但通过要求工人不要使用LLM和提高使用成本(例如禁用复制粘贴),LLM的使用率降低了约一半。二次分析进一步深入了解了LLM的使用及其预防:LLM的应用产生了高质量但同质的反应,这可能会损害与人类(而不是模型)行为有关的研究,并降低用众包数据训练的未来模型。同时,防止LLM的使用可能与获得高质量的响应不一致;例如,当要求员工不要使用LLM时,摘要中包含的携带基本信息的关键词较少。我们的估计可能会随着LLM的受欢迎程度或功能的增加以及其使用规范的变化而变化。然而,理解基于LLM的工具和用户的共同进化是保持众包研究有效性的关键,我们在广泛采用之前提供了一
研究表明,大型语言模型(LLM)在众包工作中广泛应用,约占30%。通过禁止使用LLM和提高操作难度,使用率可降低约一半。LLM产生的文本质量高但同质化,可能影响研究的准确性,同时防止LLM使用可能与获取高质量响应相冲突。
已下架不支持订阅
9万+

被折叠的 条评论
为什么被折叠?



