本文是LLM系列文章,针对《RT-Surv: Improving Mortality Prediction After Radiotherapy with Large Language Model Structuring of Large-Scale Unstructured Electronic Health Records》的翻译。
摘要
背景: 准确的患者选择对于防止无效的放疗 (RT) 治疗至关重要。依赖于结构化数据的传统生存预测模型通常缺乏精度。大型语言模型 (LLM) 为构建非结构化电子健康记录 (EHR) 数据提供了一种新颖的方法,通过整合全面的临床信息,有可能改善生存预测。
方法: 我们分析了 2013 年至 2023 年间延世癌症中心接受 RT 治疗的 34,276 名患者的结构化和非结构化数据。开源 LLM 使用单次学习构建了非结构化 EHR 数据。外部验证涉及 2020 年 3 月至 2023 年 7 月在龙仁世福兰斯医院接受 RT 治疗的 852 名患者。将 LLM 的性能与特定领域的医学 LLM 和更小变体的性能进行了比较。 使用统计、机器学习和深度学习方法开发的生存预测模型结合了结构化和 LLM 结构化数据。
**结果:**开源 LLM 在构建非结构化 EHR 数据方面实现了 87·5% 的平均准确率,而无需额外的训练。特定领域的医学 LLM 表现明显更差,准确率仅为 35·8%。事实证明,较大的 LLM 更有效,特别是在构建与患者生存相关的临床相关特征方面,例如一般状况和疾病范围。在内部验证中,深度学习模型的 C 指数从 0·737(95% 置信区间 [CI] 0·727–0·746)增加到 0·820(95% CI 0·813–0·827)。同样,在外部验证中,深度学习模型的 C 指数从 0·779 (95% CI 0·755–0·800) 增加到 0·842 (95% CI 0·823–0·859)。通过强调具有临床意义的因素,这些模型也变得更加可解释。 **解释:**通用域 LLM 尽管没有经过专门针对医疗数据的

订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



