文章主要内容总结
本文旨在比较三种人工智能(AI)模型——自然语言处理(NLP)、大型语言模型(LLM)和联合嵌入预测架构(JEPA)在急诊科(ED)分诊预测中的表现。研究以法国里尔Roger Salengro医院急诊科7个月的成人患者分诊数据为基础,回顾性分析了657例符合条件的患者数据,训练并验证了三个模型:TRIAGEMASTER(NLP)、URGENTIAPARSE(LLM)和EMERGINET(JEPA)。
研究以法国FRENCH分诊量表为金标准,通过F1分数、加权Kappa系数、Spearman相关系数、MAE、RMSE等指标评估模型预测一致性,并分析模型对住院需求(GEMSA编码)的预测能力及不同数据类型(结构化数据vs原始转录文本)下的表现。
主要结果显示,LLM模型(URGENTIAPARSE)综合得分最高(2.514),显著优于JEPA(0.438)、NLP(-3.511)及护士分诊(-4.343);其在预测住院需求(GEMSA)和处理结构化数据时表现更稳健。结论指出,LLM通过抽象患者表征实现了最准确的分诊预测,将AI整合到急诊科工作流程中可能提升患者安全和运营效率,但需解决模型局限性及伦理透明度问题。
创新点
- 多模型直接对比:首次在同一数据集上系统比较NLP、LLM、JEPA三种主流AI架构在急诊科分诊中的表现,明确LLM的优势。
- 数据整合分析:同时纳入结构化数据(人口统计学、生命体征)和非结构化数据(患者主诉转录文本),评估模型对不同数据类型的适应性。
- 双维度验
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



