本文是LLM系列文章,针对《Exploring Multilingual Large Language Models for Enhanced TNM classification of Radiology Report in lung cancer staging》的翻译。
摘要
背景:由于劳动密集型的结构化和叙事式报告,结构化放射学报告仍然不发达。深度学习,特别是像GPT-3.5这样的大型语言模型(LLM),为用自然语言自动构建放射学报告提供了希望。然而,尽管有报道称LLM在英语以外的语言中效果较差,但它们的放射学性能尚未得到广泛研究。
目的:本研究旨在调查基于使用GPT3.5 turbo(GPT3.5)的放射学报告的TNM分类的准确性,以及日语和英语多语言LLM的实用性。
材料和方法:利用GPT3.5,我们开发了一个从癌症胸部CT报告中自动生成TNM分类并评估其性能的系统。我们使用广义线性混合模型统计分析了在两种语言中提供完整或部分TNM定义的影响。
结果:完整的TNM定义和英文放射学报告达到了最高的准确性(M=94%,N=80%,T=47%,ALL=36%)。为T、N和M因子中的每一个提供定义,在统计上提高了它们各自的准确性(T:比值比(OR)=2.35,p<0.001;N: OR=1.94,p<0.01;M: OR=2.50,p<0.001)。日本的报告显示,N和M的准确率有所下降(N的准确率:OR=0.74,M的准确度:OR=0.21)。
结论:本研究强调了多语言LLM在放射学报告中自动TNM分类的潜力。即使没有额外的模型训练,所提供的TNM定义也能明显提高性能,表明LLM在放射学背景下的相关性。

订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



