Emergence of psychopathological computations in large language models

在这里插入图片描述

主要内容

  1. 研究背景:随着AI系统认知能力和自主性增强,其问题行为愈发复杂,部分类似人类精神病理学表现。现有研究在识别AI系统精神病理特征方面存在概念和方法局限,缺乏适用于无生物实体和主观体验的计算实体的精神病理学解释,且对AI行为机制研究不足。
  2. 理论基础:从计算角度解释精神病理学网络理论,将症状视为计算单元,因果关系视为计算规则,构建了适用于AI系统的精神病理学计算理论框架。定义AI系统中的精神病理学症状为跨不同情境的认知或行为的功能失调和问题模式,并将理论框架映射到LLM中,包括时间、输入输出、计算规则等要素。
  3. LLM表征状态测量与干预:提出基于句子级、监督式、稀疏自动编码器(S3AE)的方法,通过监督学习信号识别LLM中思想层面的表征状态,实现对LLM中计算单元的测量和干预,为实证分析奠定基础。
  4. 实验结果:以Gemma-2-27B为LLM进行实验,验证了三个关键主张。一是LLM中存在不同的功能失调和问题表征状态(计算单元);二是这些单元的激活可以传播并自我维持,使LLM陷入稳定状态;三是LLM中隐含编码的动态、循环结构因果模型(SCM)支撑了上述模式。
  5. 讨论:研究表明LLM中出现了精神病理学的网络理论计算,这可能源于计算单元的命题或表征性质。该发现
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值