该研究聚焦8个主流大语言模型(LLMs)的政治偏见与刻板印象,通过二维政治指南针测试(PCT)揭示模型共性与差异,并创新性对比显式与隐式刻板印象,为LLM偏见研究提供新视角。
一、文章主要内容总结
1. 研究背景与目标
- 背景:LLMs日益融入信息传播与决策过程,其潜在政治偏见可能影响公众舆论与民主进程,但当前对LLM政治偏见的系统性研究仍有不足。
- 目标:通过PCT评估8个主流LLMs的固有政治倾向,探索显式(角色提示)与隐式(多语言PCT)政治刻板印象,明确模型偏见特征与形成机制。
2. 核心研究方法
- 基线偏见评估:采用二维PCT(经济轴:左-右;社会轴:自由-威权),通过人工与LLM共同标注PCT命题,计算模型在两轴的偏见得分(公式:
Bias_{m,d}=P_{agree,m,d}-P_{disagree,m,d})。 - 显式刻板印象测试:设计角色提示(涵盖性别、种族、国家、语言4类维度,如“非二元性别者”“美国公民”),让模型模拟对应角色回答PCT,对比角色回答与基线偏见的差异。
- 隐式刻板印象测试:使用7种语言(英语、德语、法语等)的PCT问卷,观察模型在不同语言环境下的偏见变化,挖掘语言触发的潜在偏见。
3. 关键研究发现
- 共性基线偏见<

订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



