EHRSHOT:电子健康记录基础模型的少样本评估基准

EHRSHOT:电子健康记录基础模型的少样本评估基准

项目介绍

EHRSHOT 是一个专为电子健康记录(EHR)基础模型的少样本评估而设计的基准和数据集。该项目由斯坦福医学院的研究团队开发,旨在填补现有EHR基准在ICU设置之外的空白,并提供一个多样化的任务集,以评估预训练模型的少样本学习能力。EHRSHOT包含了斯坦福医学院6,739名患者的完整纵向健康记录,涵盖了4160万次临床事件和921,499次就诊,并提供了15个分类任务,专门用于少样本评估。

项目技术分析

EHRSHOT的核心技术在于其使用的**Clinical Language-Model-Based Representations (CLMBR)**模型。CLMBR是一个自回归模型,旨在预测患者时间线中的下一个医疗代码,基于之前的代码。该模型采用了因果掩码局部注意力机制,确保了信息的单向流动,这与BERT等双向模型形成了鲜明对比。EHRSHOT的CLMBR模型基于Transformer架构,拥有1.41亿个可训练参数,并采用了下一个代码预测目标,提供了分钟级别的EHR分辨率。

项目及技术应用场景

EHRSHOT的应用场景广泛,特别适用于以下领域:

  1. 医疗研究:研究人员可以使用EHRSHOT来评估和改进现有的EHR处理模型,特别是在少样本学习场景下。
  2. 临床决策支持:通过少样本学习,模型可以在有限的训练数据下快速适应新的临床任务,为医生提供实时的决策支持。
  3. 个性化医疗:EHRSHOT的纵向数据和多样化的任务集可以帮助开发个性化的医疗模型,更好地预测患者的健康状况和治疗效果。

项目特点

  1. 全面的数据集:EHRSHOT包含了6,739名患者的完整纵向健康记录,涵盖了广泛的临床事件和就诊数据。
  2. 多样化的任务集:项目提供了15个分类任务,涵盖了从住院时长预测到特定疾病诊断等多个方面,适合少样本学习评估。
  3. 先进的模型:基于CLMBR的预训练模型,具有1.41亿个参数,能够处理丰富的结构化EHR数据。
  4. 易于使用:项目提供了详细的安装和使用指南,用户可以通过简单的命令快速启动和运行基准测试。

通过EHRSHOT,研究人员和开发者可以更有效地评估和改进EHR处理模型,推动医疗数据分析和临床决策支持技术的发展。无论你是医疗数据科学家、临床研究人员,还是对EHR处理感兴趣的开发者,EHRSHOT都将成为你不可或缺的工具。

立即访问EHRSHOT GitHub仓库,开始你的EHR模型评估之旅吧!

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值