该文章聚焦开源Qwen大语言模型在金融投资决策中的表征偏差,通过系统实验揭示模型偏好的驱动因素,为金融领域LLM的安全公平部署提供依据。其创新点在于首次针对Qwen模型展开多尺度金融表征偏差研究,并提出了平衡的轮询提示法与多维度评估框架。
一、文章主要内容
- 研究背景与动机
- 金融领域广泛应用开源LLM,但现有研究较少关注模型在企业规模、行业、财务特征上的偏差,这类偏差可能扭曲风险定价与资本配置。
- 表征偏差源于训练数据无法充分反映实体多样性,导致模型偏向大型知名企业,而低估小型企业,对投资研究、信贷风险评估等关键金融场景构成风险。
- 研究方法
- 数据与分类:分析2017-2024年约300家美国上市公司,标准化估值比率、财务健康度等多维度财务特征,按GICS代码划分行业与板块。
- 提示与评分:采用两种提示变体,通过平衡轮询提示法让模型对企业两两比较,结合约束解码与令牌对数聚合,生成企业层面的置信度评分。
- 研究问题与验证:围绕“哪些企业特征影响LLM置信度”“模型偏好是否跨场景稳定”“高置信度输出是否与实证财务表现一致”三个问题,通过相关性分析、ANOVA、bootstrap重采样等方法验证。
- 核心研究结果
- 企业特征影响(RQ1)<
订阅专栏 解锁全文
425

被折叠的 条评论
为什么被折叠?



