The Hidden Bias: A Study on Explicit and Implicit Political Stereotypes in Large Language Models

该研究聚焦8个主流大语言模型(LLMs)的政治偏见与刻板印象,通过二维政治指南针测试(PCT)揭示模型共性与差异,并创新性对比显式与隐式刻板印象,为LLM偏见研究提供新视角。

一、文章主要内容总结

1. 研究背景与目标
  • 背景:LLMs日益融入信息传播与决策过程,其潜在政治偏见可能影响公众舆论与民主进程,但当前对LLM政治偏见的系统性研究仍有不足。
  • 目标:通过PCT评估8个主流LLMs的固有政治倾向,探索显式(角色提示)与隐式(多语言PCT)政治刻板印象,明确模型偏见特征与形成机制。
2. 核心研究方法
  • 基线偏见评估:采用二维PCT(经济轴:左-右;社会轴:自由-威权),通过人工与LLM共同标注PCT命题,计算模型在两轴的偏见得分(公式:Bias_{m,d}=P_{agree,m,d}-P_{disagree,m,d})。
  • 显式刻板印象测试:设计角色提示(涵盖性别、种族、国家、语言4类维度,如“非二元性别者”“美国公民”),让模型模拟对应角色回答PCT,对比角色回答与基线偏见的差异。
  • 隐式刻板印象测试:使用7种语言(英语、德语、法语等)的PCT问卷,观察模型在不同语言环境下的偏见变化,挖掘语言触发的潜在偏见。
3. 关键研究发现
  • 共性基线偏见<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值