Generative Exaggeration in LLM Social Agents: Consistency, Bias, and Toxicity

文章主要内容总结

本文研究了大型语言模型(LLMs)在模拟社交媒体政治话语时的行为,重点分析了其在2024年美国大选期间X平台(原Twitter)政治互动中的表现。研究基于1186个真实用户构建了LLM代理,通过“零样本”(仅提供最小意识形态线索)和“少样本”(提供用户近期推文历史)两种初始化方式,让代理回复政治相关推文,并对比了Gemini、Mistral、DeepSeek三个模型家族在语言风格、意识形态一致性和毒性方面的输出。

核心发现包括:

  1. 生成夸张(generative exaggeration)现象:LLMs并非简单模仿用户,而是系统地放大用户的显著特征(如意识形态倾向、情绪化表达),超出实证基线,形成“夸张重构”。
  2. 语境的双重影响:丰富的语境(少样本)提升了代理的内部一致性,但加剧了极化、风格化信号(如标签、表情符号)和有害语言。
  3. 不对称性:对右翼用户的夸张程度高于左翼用户,尽管两者均受影响。
  4. 结构性偏差:LLM输出更多反映模型内部优化动态,而非真实用户行为,这对其在内容 moderation、政治模拟和政策建模中的可靠性提出挑战。

创新点

  1. 提出“生成夸张”概念,揭示LLMs在模拟社会行为时对用户特征的系统性放大机制,突破了“LLMs是否忠实模仿”的传统视角,转向分析其“如何扭曲结构”。
  2. 对比不同模型家族(来自美、中、欧)和规模的表现,发现模型的地域背景、
### 生成式代理(Generative Agents)的概念及其在模拟人类行为方面的应用 #### 定义与背景 生成式代理是一种基于人工智能的技术框架,旨在通过复杂的多智能体系统(multi-agent systems)来模拟真实世界中的人类行为模式。这种技术的核心目标是创建能够表现出可信、动态且具有适应性的个体化行为的虚拟实体[^1]。 #### 关键特性 生成式代理的设计融入了多种高级功能模块,其中包括但不限于规划、记忆管理以及工具使用等方面的功能实现: - **规划(Planning)**: 智能体具备任务分解和自我反省的能力,这使得它们可以制定并调整短期与长期的行为策略。例如,在特定场景下,智能体会依据当前环境状态和个人历史数据重新安排每日活动计划[^5]。 - **记忆(Memory)**: 记忆机制对于维持连贯性和情境感知至关重要。它不仅存储过去发生的事件细节,还支持快速检索最相关的过往经历以指导当下决策过程。具体而言,采用最大内积搜索(MIPS)算法优化信息提取效率[^4]。 - **工具使用(Tool Use)**: 此外,这些代理还能有效运用外部资源或服务完成复杂操作——像调用自然语言处理API生成对话内容或者分析科学研究资料等案例展示了其灵活性。 #### 应用领域及效果评价 为了验证上述理论构想的实际可行性,研究者们开展了多项实验测试: - 技术层面考察单个独立运行时的表现质量;同时也关注多个相互作用下的整体生态系统稳定性. - 方法上采取了“采访”形式获取关于知识水平、行动逻辑等方面的反馈意见,并对比不同条件下(如限制访问某些核心组件)的效果差异. 结果显示,完整的架构配置显著提升了仿真精度,减少了诸如无关记忆干扰、不恰当措辞等问题的发生频率[^3]。 #### 实现流程概览 以下是构建此类系统的典型步骤说明(注意这里仅作概括介绍而非详尽指南): ```python def create_generative_agent(name, description, birth_location): agent = { 'name': name, 'description': description, 'location': birth_location, 'memory': [], 'tools': [] } def plan(): # Generate hourly schedule based on current date pass def execute_plan(): nearby_agents = get_nearby_agents(agent['location']) interact_with(nearby_agents) update_schedule() rank_memories_by_importance() return {'agent': agent, 'functions': [plan, execute_plan]} ``` 此代码片段示意如何初始化一个基础版的生成型代理对象,并定义了一些基本的操作函数用于后续扩展开发工作。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值