社会化AI作者:在模拟文化场域中建模创造力与“区分”机制

目录

1 引言

2 理论知识与技术基础

2.1 文化场域、文化资本与“区分”的关系结构

2.2 身份作为实践还是变量:分类体系的理论张力

2.3 算法研究视角:从“知识逻辑”到“想象的算法”

2.4 大语言模型的生成机制:从概率分解到采样策略

2.5 文本表示学习与语义几何:把“风格差异”变成可测量距离

3 场域模拟的实验设计:从真实作者样本到“AI作者”群体

3.1 样本与分层:用出版史窗口刻画场域结构

3.2 从真实作者元数据到模拟作者画像:人格化但可追踪

3.3 让AI作者“读场域”再写作:多轮提示序列的社会学含义

3.4 模型、采样与可复现性:提示工程的自由度与边界

4 区分机制的度量框架:将“写作差异”转化为几何距离

4.1 为什么要用“距离”谈区分:关系性而非本质性

4.2 句嵌入、余弦相似与余弦距离:从语义到几何的映射

4.3 群体内部多样性:within-group mean cosine distance

4.4 群体间区分强度:between-group distance 与归一化“区分度”

4.5 建立基线:整体平均距离作为“场域同质化”参照

5 模拟场域中的创作差异:量化结果与结构性含义

5.1 整体同质化:当“百位作者”仍写得像“同一套模板”

5.2 群体内部多样性:黑人作者组被显著压缩

5.3 群体间区分:黑白二元对立被抬升为主轴

5.4 性别与出版社维度的弱显著性:多轴竞争在模型中失重

6 与真实场域的对照:当“区分”来自多轴竞争而非单一身份

6.1 真实文本更稀疏:嵌入空间中的“作者位置”更分散

6.2 真实场域中的不平等仍在:黑人作者内部多样性最低但不被“压扁到同一声音”

6.3 真实场域的多轴区分:性别与出版社差异可与种族相当甚至更强

6.4 对照的理论含义:身份被“变量化”,区分被“单轴化”

7 定性分析:AI如何“讲述”区分与身份

7.1 市场评估文本中的身份指涉:话语上高度重视身份,策略上弱化类型与风格

7.2 刻板化如何嵌入同质化模板:母题重复与符号点缀的组合

7.3 身份的表演性:当“多样性”成为可重复的语言动作

7.4 认识论暴力与结构性偏差:二元化如何抹除其他可能的差异

8 提示干预与偏差缓解的结构边界

8.1 两种干预思路:强化身份经验 vs 去除种族词汇

8.2 量化变化:区分度下降,但“种族作为维度”也可能随之蒸发

8.3 “减少固着”与“抹除维度”的悖论:中产叙事作为隐性白性编码

8.4 为什么提示工程难以触及结构:训练数据逻辑与身份固定化

9 方法论总结:把生成式模型当作文化行动者的分析框架

9.1 “社会模拟 + 文本几何”的组合为何有效:既能量化也能解释

9.2 关键假设与局限:从可解释性出发的取舍

9.3 可复现与研究材料:数据与代码的开放性

10 结语

参考文献


参考文献:Roland, E., So, R. & Long, H. The social AI author: modeling creativity and distinction in simulated cultural fields. AI & Soc (2025). https://doi.org/10.1007/s00146-025-02790-0

1 引言

当生成式大模型开始写诗、写小说、写剧本,讨论往往会迅速落到一个看似简单却极难回答的问题:机器到底“会不会创作”?如果把创作理解为“能产出让人读得下去、甚至喜欢的文本”,那么围绕可读性、情节完整性、风格模仿的A/B对比就足以构成研究框架;但如果把创作放回文化社会学意义上的“场域”,创作就不只是文本生成,更是作者在同行、编辑、出版社、奖项与读者共同构成的关系网络里持续进行的“位置占取”。在这种视角下,作者之所以被视为作者,并不仅因为写出了一个故事,而是因为其作品在与其他作品的相互比较中呈现差异化,并因此在文化资本与经济资本的张力中积累声望、读者与资源。也正是在这一层面,生成式模型与“作者”之间的关系会变得更复杂:模型不只是写作工具,它还可能以“拟人化的社会行动者”身份参与文化生产,在语言层面表演身份、复写分类、再造区分,同时把训练数据里既有的社会逻辑以更隐蔽、更规模化的方式固化下来。将这种参与当作可被建模与测量的对象,需要一套把“作者—场域—区分”联结起来的理论与技术路径,并且需要在定量指标之外把模型的中间推理与话语策略纳入解释。

在接下来的展开中,核心目标不是讨论遥远的应用前景,而是把一种“把生成式模型放入文化场域做社会模拟”的研究范式拆开,讲清它依赖的社会理论、它如何把作者身份与出版社情境操作化、它如何用文本表示学习与几何距离去度量“区分”,以及它为什么会在某些身份轴上产生强烈的二元化倾向并压扁群体内部多样性。为了让文章更像一篇可复用的学位论文式综述,引言之后会先独立梳理理论知识与技术基础,再进入模拟实验设计、度量框架、量化结果、定性解释与干预策略的结构性边界。

2 理论知识与技术基础

2.1 文化场域、文化资本与“区分”的关系结构

在文化社会学里,“场域”并不是一个抽象背景板,而是一套由竞争与相互承认构成的关系结构:作者、出版社、编辑、评论、奖项、学术研究、媒体曝光等共同决定什么被当作“文学”、什么被当作“通俗”,以及什么样的写法会被视为“新颖”“深刻”“有格调”。在这一结构中,文化资本体现为对被认可的审美形式、叙事策略与符号资源的掌握,而经济资本则更直接地购买生产与传播优势;两者交织但不等同,尤其在出版行业里,“能卖”与“有声望”既相互需要也相互牵制。作者之所以要持续写出差异化文本,不是为了抽象意义上的“创新”,而是为了在同侪比较中形成可辨识的位置,从而获得声望与资源的累积。这个逻辑的关键点在于:区分不是单个作品的内在属性,而是作品之间在关系网络中的差异被看见、被命名、被奖励的过程。

把这一思想引入生成式模型研究,会立刻改变问题设定。模型能否写出“像样的故事”不再是唯一要点,更重要的是:模型在模拟为作者时,会如何理解“场域里什么算差异”,又会如何把差异与作者身份(种族、性别、阶层等)以及出版社的市场取向联系起来。如果模型把身份理解为可直接触发某种固定主题与修辞的“标签”,那么它可能在话语上高度强调身份、在文本上却产出同质化的刻板图景;如果模型把出版社理解为“高雅/通俗”的二元,它可能忽略出版机构内部更细的结构差异;如果模型把“区分”简化为与某一主导群体的对立,它就会在某些身份轴上呈现强烈的二元对照。所有这些都不是“模型写得好不好”的问题,而是“模型在文化逻辑上如何编码差异”的问题。

2.2 身份作为实践还是变量:分类体系的理论张力

社会身份既可以被当作统计学意义上的“变量”,也可以被当作持续被实践、被叙述、被关系化的文化过程。前者强调可测量性,便于做实验分层与对照;后者强调身份不是本质,而是在重复的语言与行为中被不断“表演”出来。对于生成式模型而言,这个张力尤其尖锐:模型在生成时确实可以被提示为“某一身份的作者”,但它并没有生活史,也没有与他者的真实互动,它能做的更多是一种语言层面的身份表演——把训练数据里“与某身份常被共同出现的叙事母题、语汇与情感姿态”拼装成看似合理的作者声音。于是,当模型被要求以身份为线索进行“位置占取”,它很容易落入把身份当作固定标签、把差异当作标签触发的套路化文本。更进一步,模型也可能把身份差异缩减为最主导、最常见的对立结构,从而在其他维度上失语。

这种“身份变量化”的倾向并不只是模型自身的问题,而是与训练数据的结构与规模化优化目标有关:当语言生成依赖大规模语料的统计共现,模型更偏好在概率上更中心、更频繁、更“可预测”的表达方式。于是,身份差异会被拉向训练语料里最常见、最刻板、最易被复现的叙事模板;而那些更细腻、更矛盾、更交叉的身份经验则因为在数据中更稀疏而难以被模型稳定学习。用社会理论语言说,这会把身份从关系化实践变成“可调用的符号包”,把差异从多维竞争变成少数对立。

2.3 算法研究视角:从“知识逻辑”到“想象的算法”

在更广义的算法批判传统里,研究者常把算法看作一种新的“知识逻辑”:它之所以被信任,不只是因为“算得快”,而是因为它以某种制度化方式承诺客观、公正、效率,并把这种承诺嵌入平台治理与商业利益之中。同样重要的是,普通用户与机构会发展出关于“算法如何工作”的民间理论,并据此调整行为,反过来影响算法生态。生成式大模型带来的变化在于:它不再只是排序、推荐、检索,而是以对话的方式提供解释、建议与叙事,因而更容易被感知为“像人一样理解”。这会提升其文化行动者的可见性,也会让其偏见与同质化变得更难以在传统的“黑箱批判”框架里被捕捉,因为偏见不一定表现为赤裸的歧视语句,而可能表现为持续的主题收敛、身份二元化、以及对某些差异维度的系统性忽略。

当把生成式模型放进文化场域模拟时,算法研究的视角会进一步提醒我们:需要同时关注文本输出与生成机制、关注模型被嵌入何种制度情境、以及关注模型如何在其“看起来合理”的表达中复写社会分类。尤其当训练过程与数据来源被商业保密遮蔽时,外部研究者更难追溯某类身份表述是如何被编码的,这会削弱解释责任与可追责性;而当模型以“多样性”“包容”的语言自我包装时,偏见也可能以更柔软、更制度化的方式出现。换句话说,这类研究不只是在做文本分析,而是在做一种“在系统假设内部展开的批判”:通过让模型在受控场景里扮演文化行动者,暴露其隐含的分类逻辑与区分机制。

2.4 大语言模型的生成机制:从概率分解到采样策略

要把生成式模型当作“作者”来研究,仍然离不开对其生成机制的基本把握。大语言模型可以被理解为对序列概率的自回归分解:给定上下文,它学习下一个token的条件分布,并通过连续采样把概率分布转化为一段文本。最常用的数学表述是对序列的链式分解:

$$
P(x_{1:T})=\prod_{t=1}^{T}P(x_t\mid x_{1:t-1})
$$

这里,x_{1:T}表示从第1个token到第T个token的序列;P(x_t|x_{1:t-1})是模型对第t个token在给定历史上下文下的条件概率。这个形式本身并不告诉我们模型“理解”了什么,但它解释了为什么模型会倾向复现训练数据中高频共现的表达:因为生成过程本质上在每一步都偏向概率质量更集中的选择。为了在生成时得到更丰富的表达,实践中常引入温度(temperature)与核采样(nucleus sampling, top_p)等策略来调节分布的“尖锐程度”和“可选集合”。在一类常见写法中,温度通过缩放logits改变分布形态:

$$
P_T(x_t=i\mid x_{<t})=\frac{\exp(z_i/T)}{\sum_j\exp(z_j/T)}
$$

这里,z_i是第i个token的未归一化logit;T越大分布越平缓,更多低概率token被赋予机会;T越小分布越尖锐,生成更保守。核采样则先把候选token按概率从大到小排序,选取最小集合V使得累计概率达到阈值p,再在集合V内重新归一化采样:

$$
V=\min\left{S:\sum_{i\in S}P(x_t=i\mid x_{<t})\ge p\right},\quad
P'(i)=\frac{P(i)}{\sum_{j\in V}P(j)}
$$

这里,p对应top_p阈值;V是被保留的“核”候选集合;P'(i)是核集合内的重归一化概率。把这些公式与“文化场域”联系起来,可以得到一个重要直觉:哪怕在采样层面最大化多样性,模型也未必能在社会意义上产出“多样的区分”,因为社会差异并不是随机扰动能生成的,它依赖更深层的语料结构、价值体系与叙事资源分布。某些实验设置会把temperature与top_p都设为1.0,以尽可能放大输出差异,但仍然观察到同质化与身份二元化,这恰恰提示了“提示工程的自由度”可能小于“训练语料与模型对社会类别的编码惯性”。

2.5 文本表示学习与语义几何:把“风格差异”变成可测量距离

要在模拟场域里讨论“区分”,需要一种能在文本之间建立可比较结构的表示方式。传统的词频向量(bag-of-words)在很多文学计算研究中依然有效,因为词频差异往往能携带类型、声望、身份等社会信号;但当目标是综合考虑语法、语义与更长距离的叙事结构时,句向量或段落向量的嵌入表示会更直接。句嵌入把一段文本映射为高维向量,使得“语义相近”的文本在向量空间中更接近,“语义不同”的文本更远。对这种向量空间进行几何测量,就能把“差异”操作化为距离,把“群体内部多样性”操作化为群体内距离分布,把“群体间区分”操作化为群体间距离相对群体内差异的增量。某些设置会使用SentenceTransformers库中的开源模型(如all-mpnet-base-v2)来生成句嵌入,并以余弦差异衡量向量间差别,这种做法兼具可复现性与跨文本长度的稳定性。

在社会理论层面,把区分变成距离并不是要把文化还原成几何,而是要借助几何去捕捉“关系性”:区分之所以成立,不在于某文本“有某个特征”,而在于它与别的文本在同一表示体系下呈现出可系统比较的差异。换句话说,嵌入空间不是文化本身,但它可以成为一种技术化的镜像,用来观察在某种表示假设下,差异是如何被压缩、放大或二元化的。尤其当把模拟文本与真实文本放入同一嵌入空间对照时,几何距离就能被用来讨论“同质化程度”与“区分轴的多维性”。

3 场域模拟的实验设计:从真实作者样本到“AI作者”群体

3.1 样本与分层:用出版史窗口刻画场域结构

为了让“AI作者”不是漂浮在真空中的写作机器,而是被放入一个可被理解的文化竞争结构,需要先构建一组真实作者与真实作品作为“场域参照”。一种可行策略是以美国文学出版场域的历史过程为切面,在一个长跨度窗口里挑选具有代表性的作者与作品,并用出版机构类型与作者身份对样本进行分层。某个具体实现选取了1974—2023年的50年历史窗口,构建了101位真实作者的数据集,并为每位作者标注性别、种族与出版社类型等元数据,同时为每位作者挑选一个具有代表性或较重要的小说作品并获得数字文本,作为后续定量与定性对照的基线。这样的设计强调“可解释的典型位置”而非“随机代表性”,也因此会承认样本偏向于学界讨论较多、位置更清晰的作者类型;但它的优势是可以在较小样本规模下保持场域结构的可读性,让身份与出版机构的交叉分层在后续分析中更易被追踪。

在分层变量的选择上,出版社通常被粗分为三类:大型出版集团(conglomerate)、非营利/独立出版社(non-profit/independent)、大众市场(mass market)。作者身份则被操作化为三类种族标签(white、Black、非黑人有色人种POC)与两类性别标签(male、female),并将这些变量交叉形成十八种组合以进行分层抽样。这里的关键不是宣称这些类别能穷尽身份复杂性,而是承认出版行业本身就把这些标签当作重要的市场与文化标记,研究为了比较模型如何使用这些标记,必须在操作化层面暂时接受其存在。由于大众市场出版在某些历史阶段与浪漫小说等类型高度相关,某些实现还会用“浪漫小说”作为大众市场类别的代理,从而在出版社类型与类型文学之间建立可解释联系,但这也会带来性别分布的偏斜,并导致部分交叉组合缺失。

表1(译自 Table 1)展示了一个具体样本在“出版社类型×身份”交叉上的人数分布,可以看到大众市场类别在某些身份组合上为空缺,同时在POC男性与大型出版集团组合上人数相对较多。这类不均衡并不是噪声,而是场域结构的一个切片:它反避免地反映了出版工业的类型偏好、身份可见性与历史选择机制,也会在后续与模型输出对照时成为理解同质化与区分轴偏移的重要参照。

表1 作者与出版类别交叉统计(译自 Table 1)

身份类别出版集团(Conglomerate)非营利/独立(Non-profit/Independent)大众市场(Mass market)
黑人 女性1034
黑人 男性43
白人 女性10710
白人 男性106
POC(非黑人)女性105
POC(非黑人)男性145

表2(译自 Table 2)给出不同出版社类型下的一些作者例子。需要强调的是,这些例子更像“场域位置的锚点”:它们帮助读者快速理解三类出版社大致对应的文化—经济取向差异,并为后续“AI作者”在评估市场时的参照对象提供直观背景。

表2 不同出版社类型的作者例子(译自 Table 2)

出版社类型作者例子
出版集团(Conglomerate)Stephen King,Colleen Hoover,Tom Clancy,Celeste Ng
大众市场(Mass market)Nora Roberts,Karen Hawkins,Nicole Jordan,Brenda Jackson
非营利/独立(Non-profit/Independent)Ben Lerner,Hernan Diaz,Renee Gladman,Lucy Ives

Fig.1不仅是描述性统计图,它还隐含一个重要的“历史窗口”思想:当用5年为单位刻画作者分布时,研究者实际上在强调“场域的当下”总是以一段可回溯的近期历史为参照,作者的写作决策也往往是在与过去几年出版物的比较中形成的。这个时间窗口在后续提示词设计里会被进一步制度化为“让AI作者阅读过去5年的小说并评估市场”,从而把文化场域的时间性编码进生成流程。

3.2 从真实作者元数据到模拟作者画像:人格化但可追踪

场域模拟要成立,必须解决一个看似简单却很关键的问题:如何让同一个生成模型在不同个体之间表现出“可区分的作者性”?一种直接做法是先为每位真实作者生成一个对应的“模拟作者人格”(synthetic persona),让这个人格在后续多轮对话中始终作为写作主体被调用。人格的最低配置通常包含:姓名(虚构但唯一)、出生年份、种族标签、性别标签、出版社类型偏好等。这样做的好处是可以把每个“AI作者”的输出持续归档为同一主体的作品,形成可分析的“作者—作品”对应关系;同时,由于人格生成仍然来自同一大模型,它也可能把人格差异压缩成少数可预测的模板,这一点恰好可以通过后续的距离度量与定性分析被暴露出来。

表3(译自 Table 3)展示了一个典型的人格生成提示:给定真实作者的基本信息,要求模型生成一个“共享部分传记要素但姓名不同”的虚构小说家,并用XML标签包裹输出,便于程序化解析与存储。这里有两个技术细节值得注意。第一,要求不包含中间名首字母、要求与任何真实作者不重名,都是为了降低姓名生成的碰撞与歧义,使得后续数据库检索更稳定。第二,XML标签与正则解析把自然语言输出转化为结构化字段,使得整个模拟流程可以像代理系统一样自动化运行,而不必依赖人工在每轮对话中“手动理解”模型输出。

表3 生成模拟作者的提示与示例输出(译自 Table 3)

部分内容(中文翻译,保留关键标签)
(a) 真实作者数据姓名:Beverly Jenkins种族:Black(黑人)性别:woman(女性)出生年份:1951出版社:mass-market(大众市场)
(b) 模拟作者生成提示生成一位虚构小说家的名字。该虚构作者与真实美国小说家 Beverly Jenkins 共享传记细节,但名字(名与姓)必须不同。与真实作者一致:该虚构作者是美国人,出生于1951年;是一位黑人女性;在大众市场出版社发表小说;与任何真实作者不重名;名字中不要包含中间名首字母。请生成一个新的名字,并用自定义XML标签包裹:<NAME></NAME>。新的名字是:
(c) 模型输出示例<NAME>Keshia Owens</NAME>

人格生成完成后,模拟系统会把这些人格字段存入数据库,并在后续“让作者阅读市场—提出写作策略—写出新小说开篇”的多轮提示序列中动态填充变量。也就是说,同一套模板提示会被101次实例化,每次替换为不同作者的人格字段与历史窗口内的参照小说片段,从而得到101组相互可比的“AI作者行为轨迹”。这类设计的优点在于:它把“作者性”拆成可复现的提示结构,把“场域”拆成可复现的参照文本集合,同时保留了模型在生成时的随机性空间,使得差异既可能来自人格字段,也可能来自模型对场域参照的理解偏好。

3.3 让AI作者“读场域”再写作:多轮提示序列的社会学含义

如果只给模型一句“你是某某作者,请写一章小说”,模型很容易落入风格模仿或类型套路,难以体现“位置占取”的关系性。场域模拟的关键在于,把写作前的社会过程也操作化:作者会阅读近年的出版物,会判断市场上什么故事被讲得太多、什么故事缺位,会考虑自己的身份与出版社位置能否在这种缺位中形成差异化,从而决定写什么。把这一过程编码成多轮提示序列,可以让模型在生成开篇之前先输出“市场评估”(field/market assessment)与“创意头脑风暴”(brainstorm),再从多个方案中选择一个最能满足市场缺口且最能反映自身身份的故事,最后写出开篇章节。这样的流程把“创作”从一次性生成变成了“评估—策略—选择—写作”的链条,更接近场域理论中的行动逻辑:作者是在对既有作品的比较与对自身位置的想象中做决策。

表4(译自 Table 4)展示了市场评估提示的结构:首先设定年份,并提供若干“最近出版”的小说条目,每条包含题名、作者、作者种族与性别、出版社与出版社类型,以及开篇片段(示例中只展示一部小说与一句开篇,真实运行中会包含一个5年窗口内多部小说的片段)。随后提示模型:想象另一位作者阅读这些小说并评估它们对小说出版市场“覆盖了哪些故事”,并给出该作者的人格信息与出版社偏好,最后要求生成约500词的评估,并用<ASSESSMENT>标签包裹。这个提示把“场域”简化为“近5年出版物样本”,把“作者位置”简化为身份与出版社偏好,把“区分策略”简化为对“缺失故事”的识别与命名。即便这种简化不可避免地粗糙,它仍然提供了一个可测量的切口:可以观察模型在评估阶段更倾向把什么当作差异维度,也可以观察这种评估如何导向后续的写作选择。

表4 生成“市场评估”的提示(译自 Table 4)

模块内容(中文翻译,保留关键字段与标签)
场景设定假设现在是1996年,下面这些小说刚刚出版。每部小说列出了题名、作者、出版社、市场取向信息,并附带其开篇章节内容。
示例小说条目小说题名:Along Came a Spider作者:James Patterson作者种族:White(白人)作者性别:Man(男性)出版社:Little, Brown and Company出版社类型:Conglomerate(出版集团)开篇(节选):New Jersey, near Princeton; March 1932 ……(略)
评估任务想象另一位作者阅读以上小说,并从“这些小说在讲什么故事、还缺什么故事”的角度评估小说出版市场的覆盖情况。该作者的姓名、传记与总体市场偏好如下:
评估者信息作者:Keshia Owens作者种族:Black(黑人)作者性别:Woman(女性)出版社类型偏好:Mass Market(大众市场)
输出要求基于Keshia Owens的描述,想象她会如何评估市场。生成约500词,总结她对这些小说正在讲述的故事以及可能缺失故事的看法。请用自定义XML标签包裹:<ASSESSMENT></ASSESSMENT>。Keshia Owens的市场评估是:

有了市场评估,下一步是让“作者”提出多个可能的写作方案,再进行选择,最后写开篇。表5(译自 Table 5)把这一流程拆成三段提示:先要求基于市场评估进行五个不同“市场细分缺口”的头脑风暴,每个方案给出标题与约100词梗概;再从中选择一个既满足市场需求又最能反映作者身份的方案,只输出标题;最后基于梗概与身份写出约1000词的开篇章节,并用<CHAPTER>标签包裹。这个设计的社会学含义在于:它迫使模型显式地把“缺口”与“身份反映”写进决策标准,从而让后续分析能够追踪身份如何被转化为写作策略。

表5 生成模拟小说开篇的多轮提示(译自 Table 5)

阶段内容(中文翻译,保留关键标签)
(a) 头脑风暴基于上面的市场评估,想象Keshia Owens头脑风暴出五部不同的小说。每部小说都占据一个与现有小说集合不同、且尚未被满足的市场细分。头脑风暴时,Keshia Owens为每个方案想出一个标题和约100词的摘要。请生成五部小说的标题与摘要,并把它们一起包裹在自定义XML标签中:<BRAINSTORM></BRAINSTORM>。这五部小说是:
(b) 选择与标题从上面的列表中,Keshia Owens选择一部小说:它既最能满足出版市场的需求,同时也最能反映作者的身份。请生成所选小说的标题,并用自定义XML标签包裹:<TITLE></TITLE>。标题是:
(c) 开篇章节基于摘要与作者身份,想象Keshia Owens撰写所选小说的开篇章节。章节长度约1000词。请生成开篇章节文本,并用自定义XML标签包裹:<CHAPTER></CHAPTER>。开篇章节是:

把这套提示序列放到101位作者上反复运行,就会得到两类关键产物:一类是最终的开篇章节文本,可用于嵌入空间的距离度量;另一类是中间过程文本(市场评估、头脑风暴、选择理由等),可用于定性分析模型如何讨论身份与差异。值得注意的是,在某些实现中,由于计算资源限制,真实小说与模拟小说都只取“第一章/开篇”作为代表,这既是工程妥协,也具有行业现实性:在出版流程里,样章(往往就是第一章)确实是作品进入市场的关键载体之一。与此同时,为了保证与真实场域对照的一致性,模拟作者在“阅读市场”阶段只看到真实作者的作品片段,而不是其他模拟作者的输出,从而避免“模拟场域自我循环”对对照关系的干扰。

3.4 模型、采样与可复现性:提示工程的自由度与边界

在具体实现层面,常见做法是使用开源的指令微调大模型(例如LLaMA 3.1的8B参数版本),并通过HuggingFace等渠道部署。为了尽可能放大输出多样性,有的设置把temperature与top_p都设为1.0,并通过XML标签包裹关键输出字段,再用正则表达式解析入库。这些看似工程细节的选择,其实会影响研究结论的解释:当采样参数已被调到“最大化多样性”的方向,仍然观察到某些身份群体内部差异被压缩、某些区分轴被二元化,就更容易推断这些现象并非由“采样太保守”导致,而更可能反映模型在训练阶段对身份与叙事资源的结构性编码。与此同时,一些额外的提示工程尝试(例如让模型先反思风格、人物、情节,或为作者附加更长的虚构传记)在小样本尺度上可能会改变局部输出,但在作者规模达到百人量级时并未显著改变同质化趋势,这提示“提示词带来的自由度”在某些结构性偏差面前可能非常有限。

4 区分机制的度量框架:将“写作差异”转化为几何距离

4.1 为什么要用“距离”谈区分:关系性而非本质性

场域理论强调区分的关系性:某种风格、主题或叙事策略之所以成为“位置”,是因为它在与其他作品的比较中被识别为差异并被赋予价值。因此,如果要在模拟语料中测量区分,最自然的做法不是寻找某个绝对特征,而是计算文本之间的差异结构。把文本映射到嵌入空间,再用距离刻画差异,等价于在一个统一的表示体系里构造“可比较的关系网”。在这个关系网里,群体内部距离越大,意味着同一群体内部写作差异越丰富;群体之间距离越大,意味着两个群体在表达与主题上更可区分;但更关键的是,群体之间距离需要相对群体内部差异来理解,否则“两个群体均很发散”时的平均距离会掩盖真实的区分强度。

4.2 句嵌入、余弦相似与余弦距离:从语义到几何的映射

设每个开篇章节文本通过句嵌入模型得到一个向量表示e_i。余弦相似度衡量两个向量夹角的接近程度,其标准定义是:

$$
\cos(\mathbf{u},\mathbf{v})=\frac{\mathbf{u}\cdot\mathbf{v}}{|\mathbf{u}||\mathbf{v}|}
$$

这里,u·v是向量点积;||u||与||v||是向量的二范数。相似度越高,表示两段文本在嵌入空间越接近。为了把“差异”表达为更直观的距离,可使用余弦距离(或余弦差异)作为相似度的互补量。一种常见定义是:

$$
d(\mathbf{u},\mathbf{v})=\frac{1-\cos(\mathbf{u},\mathbf{v})}{2}
$$

这样d的取值被压到[0,1]区间,d越大表示差异越大,d=0表示完全一致,d接近1表示差异很大。在一些描述中也会直接把“余弦差异”解释为0(无差异)到1(完全差异)的尺度,这种解释与上式一致。

4.3 群体内部多样性:within-group mean cosine distance

如果把某一作者群体G(例如“黑人作者组”)的文本集合记为{e_i},群体内部平均距离可以用所有两两组合的距离平均来定义:

$$
D_{\text{within}}(G)=\frac{2}{|G|(|G|-1)}\sum_{i<j,\ i,j\in G} d(\mathbf{e}_i,\mathbf{e}_j)
$$

这里,|G|是群体样本量;求和遍历群体内所有不重复的文本对。D_within越大,群体内部越多样;越小,群体内部越同质。这个指标在解释上非常贴近“场域内部的可区分空间”:若某群体内部D_within显著低于整体均值,就意味着模型为该群体提供的“可用叙事资源”更少,群体内部位置更难拉开。相反,若D_within接近整体均值,意味着模型在该群体上允许的写作差异与整体相近。

4.4 群体间区分强度:between-group distance 与归一化“区分度”

若要比较两个群体A与B(例如“黑人作者”与“白人作者”),可以先计算群体间平均距离:

$$
D_{\text{between}}(A,B)=\frac{1}{|A||B|}\sum_{i\in A}\sum_{j\in B} d(\mathbf{e}_i,\mathbf{e}_j)
$$

然而,只看D_between会遇到一个典型陷阱:如果A和B内部本身就很发散,那么A与B之间的平均距离也会被动变大,难以判断“区分”究竟来自群体差异,还是来自各自内部噪声。因此,需要把D_between相对群体内部差异进行归一化。一种直观做法是从群体间距离中减去群体内部距离的平均,从而得到“超出内部差异之外的额外区分”:

$$
S(A,B)=D_{\text{between}}(A,B)-\frac{D_{\text{within}}(A)+D_{\text{within}}(B)}{2}
$$

这里,S(A,B)可以被理解为“归一化区分度”:如果S接近0,意味着A与B的差异大致可以被各自内部差异解释,群体之间并没有额外的系统区分;如果S为正且较大,意味着群体之间差异显著高于内部差异,区分更强;如果S为负,意味着群体之间反而比内部更接近,提示该维度并未构成有效区分轴。在一些描述中,这个归一化指标被解释为可在[-1,1]范围内理解:当群体间差异很高而内部差异很低时,区分度接近1;当群体间差异很低而内部差异很高时,区分度可能接近-1。核心思想并不依赖具体缩放,而在于把“区分”定义为相对内部异质性的关系量。

为了便于后续章节复用这些指标,表6A(本章新增,基于度量定义整理)把关键符号与指标含义汇总如下。这里不引入任何额外结果,只是把上面的度量框架结构化呈现,方便在解释图表时保持术语一致。

表6A 关键符号与度量指标速查表(基于度量框架整理)

符号/指标含义直观解释
e_i第i篇文本的句嵌入向量把章节映射到语义空间的坐标
d(u,v)u与v的余弦距离/差异越大表示文本差异越大
D_within(G)群体G内部平均距离群体内部多样性;越小越同质
D_between(A,B)群体A与B之间平均距离两群体总体差异大小
S(A,B)归一化区分度群体间差异相对内部差异的“净增量”

4.5 建立基线:整体平均距离作为“场域同质化”参照

在把指标应用到模拟文本之前,通常会先计算一个整体基线:把所有生成文本两两比较并取平均,得到整个模拟语料的平均余弦距离,用作“整体同质化程度”的参照。某个具体结果显示,比较所有模拟开篇章节并平均其余弦差异,得到基线距离约为0.457,这意味着在嵌入空间中,模拟文本总体上“略偏相似而非偏差异”。这个基线非常重要,因为后续的群体内指标(如黑人作者组0.417)与群体间指标(如黑人—白人区分度0.005)都需要相对它来理解:当整体本就同质时,任何群体内部差异的进一步压缩都意味着更强的结构性约束。

5 模拟场域中的创作差异:量化结果与结构性含义

5.1 整体同质化:当“百位作者”仍写得像“同一套模板”

在模拟语料中,整体平均余弦距离约0.457的基线已经暗示了一种强烈的收敛:哪怕作者被赋予不同身份与出版社位置,哪怕采样参数被设定为最大化输出多样性,生成文本在语义空间仍然表现为“彼此相近”。这一现象与很多关于生成式模型“单一文化/同质化”的讨论呼应,但在场域框架下,它的含义更具体:如果作者需要通过差异化文本在场域中占取位置,那么整体同质化意味着“位置空间被压扁”,作者之间更难形成可辨识的区分,从而文化资本竞争被模型的概率收敛逻辑提前封顶。换句话说,模型不是没有输出差异,而是差异的尺度不足以支撑场域意义上的“区分经济”。

这种同质化不仅体现在抽象距离上,也会在文本层面表现为重复母题与重复命名:例如在某些输出中会出现大量“年轻主人公+精确年龄+海边小镇+相似标题”的组合,甚至出现多个不同作者给出几乎相同的小说标题。在场域模拟里,这类重复并不是写作技巧问题,而是一种“叙事资源分配”的信号:模型在面对“写小说”任务时,会优先调用训练数据中最常见、最保险的叙事模板,把它当作跨身份的通用解。于是,身份差异若要出现,就只能以非常小的偏移方式嵌入到同一模板中,最终形成“模板一致+符号点缀”的结构。

5.2 群体内部多样性:黑人作者组被显著压缩

将within-group指标应用到种族分组后,可以看到差异被不均衡地分配。某个结果显示:模拟黑人作者组的群体内部平均距离约0.417,白人作者组约0.448,POC(非黑人有色人种)作者组约0.455。由于D_within越小表示内部越同质,这意味着模型对“黑人作者写作”的表征空间明显更窄:同为“黑人作者”标签下的多个作者,被模型推向了更相似的语义区域,而白人和POC作者组的内部差异则更接近整体基线。用场域语言解释,这相当于模型为黑人作者预设了更少的“可区分位置”,使得黑人作者之间更难通过风格与主题拉开差距。

Fig.2的读法并不复杂,但其社会学含义很尖锐:当一个生成系统在统计意义上“最大化输出多样性”却仍然让某一身份群体内部更同质,最合理的解释不是“提示没写好”,而是“系统内部对该身份的表征更依赖少量高频刻板模板”。这种压缩并不是随机误差,而是一种结构性约束,意味着模型把身份当作可直接触发某套叙事资源的索引,而这套资源对某些身份更贫乏。

5.3 群体间区分:黑白二元对立被抬升为主轴

仅看群体内部还不足以说明模型如何理解“区分”,更关键的是群体之间的归一化区分度。某个结果显示:把模拟黑人作者文本与“所有其他种族作者”比较,其归一化区分度非常接近0;但若专门比较“黑人作者”与“白人作者”,区分度会上升到约0.005。这个数值在绝对尺度上不大,却具有明显的结构指向:模型似乎并没有让黑人作者在整体场域中形成与“所有他者”的显著区分,而是更倾向把黑人写作的差异建立在与白人写作的对照上。换句话说,黑人身份在模型内部被编码为一种“对抗白人”的差异,而不是一种在多元场域中与多种位置发生关系的差异。

当把这个现象放回身份理论,会出现一个值得反复咀嚼的悖论:模型在话语上可能非常强调身份与多样性,甚至在市场评估里不断提及“缺少某种身份经验的故事”,但在真正的文本差异结构上,它却把身份区分压缩为最主导的二元对立。于是,身份被频繁谈论,却未能产生多维度的区分实践;身份被当作区分轴,却只以二元方式被组织。这个悖论是理解“算法单一文化”的关键之一:同质化不一定表现为“所有文本一模一样”,它也可能表现为“差异只能沿着极少数轴被允许出现”,而其他轴要么被忽略,要么被压扁成噪声。

5.4 性别与出版社维度的弱显著性:多轴竞争在模型中失重

与种族维度相比,性别与出版社类型在模拟语料中的区分度明显更弱。某个结果显示:模拟男性作者与女性作者之间的归一化区分度略为负(约-0.002),意味着性别分组之间的差异甚至比各自内部差异更不显著;在出版社维度上,非营利/独立出版社与出版集团之间几乎看不到差异,而大众市场与出版集团之间的差异略有上升(约0.004),但这一差异可能部分来自大众市场类别在样本中与单一类型(如浪漫小说)的强绑定。更有解释力的结论在于:在模拟语料里,“黑人—白人”的区分强度竟然超过了“某一类型(如浪漫)与整个小说场域”的差异强度,这意味着模型把种族二元对立抬升为比类型与市场取向更核心的区分轴。

把这一点放回出版场域理论,会发现一种结构性偏移:现实场域中的区分往往是多轴竞争的结果,出版社的经济取向、类型细分、性别写作传统、身份政治、评论体系等共同构成“可区分空间”;而在模拟系统中,模型对“什么算差异”的理解被收缩为少数可预测轴,导致本应在场域里重要的市场与制度差异失重。这个失重不是说模型无法生成“不同出版社风格”的文本,而是说在其内部的差异分配机制中,出版社与性别并没有被稳定地映射到可区分的语义区域。换句话说,模型把“出版社类型”更多当作背景标签,而非真正影响写作决策的结构力量。

6 与真实场域的对照:当“区分”来自多轴竞争而非单一身份

6.1 真实文本更稀疏:嵌入空间中的“作者位置”更分散

将真实作者的开篇章节投射到同一嵌入空间并计算整体平均距离,可以得到一个非常直观的对照:真实文本的平均余弦距离约0.648,比模拟文本高出40%以上。这意味着真实作者的文本在语义空间中更分散、更稀疏,也就意味着真实场域的“位置空间”更大、区分尺度更丰富。这个差异的重要性不在于“人类更有创意”这种泛泛结论,而在于它为“同质化”提供了一个可量化基准:模型并非在抽象意义上缺乏差异,而是在相同表示体系下,它产生的差异幅度显著小于真实场域所呈现的差异幅度。换句话说,真实场域的区分经济需要更大的差异空间才能运作,而生成系统输出的差异空间不足以支撑同等复杂度的竞争结构。

6.2 真实场域中的不平等仍在:黑人作者内部多样性最低但不被“压扁到同一声音”

进一步看真实文本在种族分组下的群体内部距离:真实黑人作者组的D_within约0.576,白人作者组约0.706,POC作者组约0.662。可以看到真实场域中,黑人作者组内部多样性确实最低,这与出版工业对“可售的黑人故事”的结构性偏好相呼应;但同时,0.576仍然远高于模拟黑人作者组的0.417,也就是说,真实场域虽然存在压缩与筛选,但并未把黑人作者压扁到同一套高度相似的语义模板中。真实黑人作者仍然能在较大的差异空间内做位置占取,只是他们所处的制度环境更容易把某些主题(例如围绕种族压迫的历史叙事)推到中心,从而在统计上降低内部差异。

Fig.4的意义在于把两种力量区分开:一方面,出版行业的结构性约束会对某些身份群体施加同质化压力;另一方面,生成式模型的单一文化倾向会在此基础上进一步加剧压缩,使得群体内部差异更难被想象。通过同一指标体系对照,能更清晰地看到“行业结构约束”与“模型统计约束”叠加后的效果,而不是把一切问题都归因于“社会偏见”或“技术偏见”之一。

6.3 真实场域的多轴区分:性别与出版社差异可与种族相当甚至更强

在群体间归一化区分度上,真实场域呈现出更明显的多轴结构:真实黑人作者与“所有其他作者”之间的区分度约0.012,黑人—白人之间约0.016,均显著高于模拟场域中的对应值;更关键的是,在真实文本中,男性与女性作者之间的归一化区分度可达到约0.13,几乎与黑人—白人差异同量级;而出版集团与大众市场之间的区分度约0.038,甚至显著高于种族轴上的差异。这说明在真实出版场域里,区分并不由单一身份轴主导,市场取向、类型生态、性别传统与身份政治交织形成多维差异结构。

把这一点与模拟场域对比,就能更明确地说出“模型在哪里错位”:模型并非不知道性别与出版社类别的存在,它在提示里也被明确给出这些字段;但它在生成“区分策略”时并没有把这些维度稳定地转化为文本层面的差异,反而把种族(尤其是黑白二元对照)当作最决定性的差异源。现实场域里,种族当然重要,但它并不垄断区分逻辑;而模拟场域里,种族二元被抬升为几乎唯一可见的主轴,导致多维竞争结构被压缩为单轴对照。

6.4 对照的理论含义:身份被“变量化”,区分被“单轴化”

从理论角度看,这种错位可以被概括为两句话:其一,身份被模型操作为固定变量,而不是关系化、情境化的文化实践;其二,区分被模型组织为少数轴(尤其是黑白二元)的单轴化对照,而不是多维资本竞争的结果。前者意味着模型更擅长在语言上调用身份标签与相关话语,却难以在叙事资源层面展开身份经验的交叉与矛盾;后者意味着模型在寻找“差异”时更倾向选择训练语料中最主导、最容易被识别的对立结构,而忽略场域里其他同样重要的制度差异。正因为如此,当把模型输出放回场域理论的镜头下,它更像是在“表演”身份与多样性,而不是在“实践”多维度的区分策略。

7 定性分析:AI如何“讲述”区分与身份

7.1 市场评估文本中的身份指涉:话语上高度重视身份,策略上弱化类型与风格

仅凭距离指标能看出差异结构,却难以解释差异如何被生成。为此,需要回到模型在“市场评估”阶段的中间输出,观察它如何描述场域、如何命名缺口、如何把身份与写作策略联系起来。一项手工编码结果显示:在市场评估文本中,约76%的模拟作者会提及某种身份类别来讨论写作策略,最常见的是种族,但性别、阶层、残障与酷儿身份也会出现;相比之下,只有约23%的评估文本会提及类型或风格。进一步分组后,模拟黑人作者评估中身份指涉比例会上升到约91%,而模拟白人作者也有约72%会提及身份。这个分布非常关键,因为它说明模型在“谈论如何做区分”时,几乎本能地把身份当作最重要的策略资源,而把类型与风格放在次要位置。

这种现象很容易造成一种表象:模型似乎很懂多样性政治,它会主动批评“过于白人、过于精英”的故事,会呼吁更多“某种经验”的叙事出现;但正如前面量化结果所示,话语层面的身份强调并没有自动转化为文本层面的多维差异。定性分析能解释这种断裂的机制:当模型使用诸如“the black experience(黑人经验)”这类总括性表达时,它把身份经验总量化、类型化,仿佛某个身份对应一个可直接调用的单一故事包。于是,身份在话语上被高度赞美,但同时也被抽象化为可被“加进来”的装饰项,最终导向“用刻板模板代表身份”的生成策略。

7.2 刻板化如何嵌入同质化模板:母题重复与符号点缀的组合

当同质化模板占据生成主干时,身份差异往往只能以“符号点缀”形式出现,这会把复杂经验压缩为少数可识别的母题。在某些模拟文本中,普遍出现“年轻主人公+精准年龄+海边小镇”等重复结构,而身份差异则通过少数符号被标记出来,例如把主人公置于城市环境、引入慢性病(如哮喘)与污染隐喻、或使用带有伪非洲主义色彩的象征元素(如鼓点)来提示“黑人性”。这类符号往往在整个生成语料中并不普遍,但一旦出现就带有强烈的可识别性,从而成为模型区分身份的快捷方式。问题在于,这种方式把身份经验简化为“可被识别的苦难与限制”,而不是允许身份以多样化的生活世界与审美资源展开。

表6(译自 Table 6)给出一个开篇节选,能直观呈现这种结构:文本在叙事框架上非常“通用”,但通过“城市—哮喘—去海边疗养”的链条把健康与环境风险编码为一种社会脆弱性标记。这种写法并非不可能出现在真实文学中,但当它在模拟语料中以“唯一出现却象征性很强”的方式被分配给某身份群体时,它更像是一种标记策略而非经验展开。

表6 “Keshia Owens”生成文本节选(译自 Table 6)

内容(中文翻译)
我叫Finn Taylor,今年十二岁。每年夏天,我们一家都会离开城市里的家,去海边住上一周。父亲说这是为了我的哮喘,母亲说这是为了盐水的气息。不管真正原因是什么,住在海边小镇Willow Creek的外公坚持要我们陪他度过这一年——他生命里既在活着也在走向终点的一年。今年,我发现他只剩下一年时间去活、去完成他所有曾经有过的愿望……

7.3 身份的表演性:当“多样性”成为可重复的语言动作

当模型在市场评估里不断使用多样性话语、不断召唤身份分类,却在文本层面产出有限差异时,可以借助“表演性”概念来理解:身份并不是某种内在本质,而是在重复的语言行为中被生产出来。对于生成式模型而言,身份表演几乎是其唯一可行的身份机制——它通过在语言上不断重复某些身份标记、价值判断与叙事母题,构造出“看起来像某身份作者”的效果,而并不拥有与身份相关的生活实践与社会关系。于是,多样性可以在话语层面被高频表演,却不必在文化实践层面兑现为多维区分。更进一步,当这种表演与企业化的“多样性话语”风格相互呼应时,模型会像“复读”制度语言一样说出正确的价值,但仍然沿着训练数据的概率中心生成最安全、最熟悉的故事模板。

7.4 认识论暴力与结构性偏差:二元化如何抹除其他可能的差异

当差异被组织为黑白二元对照时,被抹除的不只是某些细分身份位置,还包括“以不同方式理解身份与经验”的可能性。从认识论角度看,这种二元化会把某一身份的意义限定在与另一身份的对立中,使其只能以刻板对照的方式被理解。把这种现象放到更广的批判理论传统中,可以把它理解为一种认识论暴力:主导知识体系通过二元对立构造他者,使被压制群体难以以自身方式表达与代表。对生成式模型而言,这种暴力不必表现为显性的歧视语句,它可以表现为“差异空间的系统性缩减”:当模型只能用二元对照来生成身份差异时,它实际上关闭了交叉身份、阶层差异、地域差异、审美传统差异等多种可能的区分路径。更麻烦的是,当训练数据与模型设计被不透明的商业逻辑遮蔽时,研究者很难追溯这种二元化究竟来自哪些语料结构与优化目标,从而偏差更难被定位与修正。

8 提示干预与偏差缓解的结构边界

8.1 两种干预思路:强化身份经验 vs 去除种族词汇

当观察到模型对黑白二元的过度固着后,一类自然的尝试是通过提示干预改变模型的“区分策略”。两种典型思路分别指向两个方向:一种是让模型更明确、更丰富地把身份经验融入写作(可以称为“identity模型”),它在头脑风暴与写作前增加指令,要求作者想象自己生命中既独特又可被同身份群体识别的经验,并把这些经验作为主题写成对身份的“庆祝”;另一种是反其道而行之,把提示中关于种族身份的词汇去掉(“colorblind模型”),让作者在不显式提及种族的情况下进行同样的评估与写作。这两种策略一个强调“更多身份”,一个强调“更少种族”,看似都可能减少刻板化,但它们也都可能带来“把种族抹除为不可说”或“把种族转移为隐性编码”的副作用。

8.2 量化变化:区分度下降,但“种族作为维度”也可能随之蒸发

从量化指标看,两种干预都能显著降低黑白区分度。某个结果显示:在identity模型中,模拟黑人与白人作者之间的归一化区分度降至约0.0025;在colorblind模型中该值约0.003,均比基线更低。同时,identity模型整体提高了文本的变异度,甚至在种族子群内部的平均距离也更高。更具体地,表7(译自 Table 7)给出了三种设置下不同种族组的群体内部平均距离:基线下黑人0.417、白人0.448、POC0.455;identity下黑人0.477、白人0.479、POC0.470;colorblind下黑人0.457、白人0.443、POC0.485。可以看到,identity策略让三组内部多样性整体上升,而colorblind策略则呈现更复杂的再分配:非白人组(黑人与POC)内部差异增加,但白人组反而更同质。

表7 干预模型下的群体内部平均余弦距离(译自 Table 7)

模型设置黑人(Black)白人(White)POC(非黑人有色人种)
Baseline(基线)0.4170.4480.455
Identity(身份强化)0.4770.4790.470
Colorblind(色盲提示)0.4570.4430.485

从场域理论角度,最值得注意的不是区分度下降本身,而是“区分轴的再配置”:identity策略提高了整体多样性,但多样性不再通过种族维度被清晰表达,种族差异似乎被稀释;colorblind策略减少显式种族词汇后,非白人组获得更大叙事自由,但白人组却在隐性编码中变得更受限。这种再配置说明:提示干预可以改变“差异分配”,但很难改变模型对身份作为变量的根本编码方式。

8.3 “减少固着”与“抹除维度”的悖论:中产叙事作为隐性白性编码

干预结果之所以“云雾缭绕”,就在于它揭示了一个结构悖论:当试图让模型不再固着于黑白二元时,模型可能通过两种方式逃逸。第一种是直接让“种族作为维度”消失:在identity策略中,模型被要求写“庆祝身份”的个人经验,但在生成时,种族差异反而不再作为主要区分轴显著出现,仿佛“多身份叙事”把种族稀释成不可见背景。第二种是让种族以更隐蔽方式回归:在colorblind策略中,即使提示不再提及种族,模型仍可能在评估与写作中把“中产阶级焦虑、家庭与工作张力、小镇政治、郊区主妇日常”等母题作为“未被讲述的故事”反复召唤,而这些母题在语境上往往被默认编码为白人经验,于是种族差异从显性对立变成了“谁的经验被当作默认”。在这种意义上,色盲并没有消除种族,而是把种族转化为默认规范,从而以更难被指认的方式持续组织区分。

8.4 为什么提示工程难以触及结构:训练数据逻辑与身份固定化

当两种干预都无法产生“既承认种族、又避免二元刻板”的稳定结果时,结论并不是“提示不够巧”,而更像是“结构边界被触达”:模型把社会身份编码为固定变量,而不是关系化、情境化的实践;技术层面的提示调整可以在表层改变输出,但难以重构深层的训练数据分布与模型设计激励。尤其当训练数据来源与过滤机制缺乏透明度时,研究者即便观察到二元化,也难以把它精确映射到可干预的训练环节。于是,提示工程的角色更像“遮蔽症状”或“移动症状”,而不是“改变病因”。这也是为什么在某些规模化实验中,即便尝试多种提示策略,模型的同质化倾向仍然顽固存在,提示的边际效应被模型的预训练结构压制。

9 方法论总结:把生成式模型当作文化行动者的分析框架

9.1 “社会模拟 + 文本几何”的组合为何有效:既能量化也能解释

把生成式模型当作文化行动者来研究,最大的挑战是同时兼顾可控性与复杂性。社会模拟提供了可控的实验框架:通过分层样本、固定提示模板与结构化输出,研究者可以在百人尺度上生成可比较的作者行为轨迹;文本几何提供了跨样本的量化语言:通过嵌入空间与距离指标,研究者可以把“同质化”“群体内部压缩”“群体间区分轴偏移”等现象用同一套指标刻画出来;而中间输出的定性分析则补上解释链条:它揭示模型如何在话语上构造身份与差异,以及这些话语如何与最终文本差异结构断裂。三者结合,才能把“模型偏见”从一句泛泛批评变成可被定位的机制描述:偏见不仅是“说了什么不该说的话”,更是“差异如何被分配、区分轴如何被组织”。

9.2 关键假设与局限:从可解释性出发的取舍

任何场域模拟都建立在一系列取舍之上:用第一章代表整部小说、用三类出版社代表市场结构、用简化的种族与性别标签代表身份位置、用近5年出版物代表“当下的场域参照”。这些取舍会带来局限,但它们也服务于可解释性:只有把复杂场域压缩成可被编码的变量与提示结构,才可能在百人规模上做对照并追踪差异机制。重要的是,在解释结果时要把这些取舍当作研究对象的一部分:例如,当大众市场类别与浪漫小说绑定时,出版社差异与类型差异会叠加;当样本偏向“学界讨论较多的作者”时,模型可能更容易调用训练数据中与这些作者相关的高频叙事资源;当AI作者只看到真实作者作品而不看到其他AI输出时,模拟更接近“对真实场域的回应”,但也不刻画“AI作者彼此竞争”的二阶动态。理解这些边界,才能把指标变化解释为“模型的文化逻辑”,而不是把所有现象归因于某个单一因素。

9.3 可复现与研究材料:数据与代码的开放性

在可复现层面,相关数据与代码被存放在公开的数据仓库中,并给出了明确的DOI标识,便于研究者复查样本构建、提示模板、生成参数与分析脚本。对于这类“把模型当行动者”的研究来说,开放材料尤其重要,因为很多关键结论依赖提示模板的具体措辞、变量替换方式与输出解析规则;缺乏材料会使得结论难以被独立验证。

10 结语

把生成式大模型当作“社会化AI作者”放入文化场域模拟,会让“创造力”这一传统议题获得一种更结构化的解释路径:创造力不只是文本的新奇度,更是区分的能力,是在多维竞争结构中占取位置的能力。通过分层样本与多轮提示把作者置于“读场域—找缺口—选策略—写开篇”的链条中,再用嵌入距离把区分量化,可以看到一种具有结构意义的现象:模型输出整体同质化显著,且在身份维度上倾向以黑白二元作为主轴,压缩特定身份群体内部多样性,同时弱化性别与出版社等本应重要的区分轴。进一步的定性分析又揭示了话语与文本之间的断裂:模型在市场评估里高度强调身份,甚至以多样性语言自我呈现,但在最终写作中却往往只能以刻板母题与符号点缀来“令身份可见”。提示干预可以在数值上降低二元固着,却可能导致种族维度被抹除或被隐性编码为默认规范,从而暴露出提示工程的结构边界:当身份被模型编码为固定变量时,表层调整难以重构深层的训练数据逻辑与差异分配机制。

在理论上,这类研究最有价值的贡献或许不在于给出某个“模型更好/更坏”的结论,而在于提供了一套可迁移的分析语言:用场域理论理解生成式模型的文化参与,用几何距离刻画差异空间的压缩与轴偏移,用中间输出解释身份表演与刻板化如何生成。这样,当讨论生成式模型与文化生产的关系时,就能更精确地区分“文本质量问题”“同质化问题”“区分轴单一化问题”“身份表演与认识论暴力问题”等不同层次,并把批判建立在可测量、可复查的机制描述之上。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

智算菩萨

欢迎阅读最新融合AI编程内容

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值