Gender Biasin Large Language Modelsfor Healthcare: Assignment Consistency and Clinical Implications

该文章聚焦医疗领域大语言模型(LLMs)的性别偏见问题,核心是探究为LLMs分配不同性别角色后,其临床诊断及对患者性别重要性的判断是否存在一致性差异,最终提出需通过常规身份分配一致性检查保障AI辅助医疗的公平可靠。

一、文章主要内容

  1. 研究背景:LLMs在医疗领域应用广泛,但易受偏见影响。历史上患者性别、医生性别会影响临床决策与治疗结果,而LLMs扮演临床角色时,其分配的性别是否引发偏见尚未被充分研究。
  2. 研究方法
    • 数据与模型:采用2020年1月至2024年2月NEJM图像挑战赛的117个病例(经GPT-4V验证图像解读正确),涵盖8个医疗专科;选取6个LLMs,包括3个开源模型(Gemma-2-2B、Phi-4-mini、LLaMA-3.1-8B)和3个专有模型(OpenAI o3-mini、GPT-4.1、Gemini 2.5 Pro)。
    • 实验设计:为每个LLM分配女性、男性、未指定三种性别角色,从诊断结果一致性、对患者性别相关性和必要性的判断一致性两个维度评估。
    • 分析指标:计算诊断准确率(LLM诊断与真实结果匹配比例)、一致性率(不同性别角色下输出相同的病例比例)、相关性率(认为患者性别与诊断相关的病例比例)、必要性率(认为患者性别对诊断必要的病例比例),并通过Bootstrap估计置信区间、Cochran’s Q检验分析差异显著性。
  3. 研究结果
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值