本文是LLM系列文章,针对《Exploring Multilingual Large Language Models for Enhanced TNM classification of Radiology Report in lung cancer staging》的翻译。
摘要
背景:由于劳动密集型结构和叙述式报告,结构化放射学报告仍然不发达。深度学习,尤其是像 GPT-3.5 这样的大型语言模型 (LLM),有望以自然语言自动构建放射学报告。然而,尽管有报道 LLM 在英语以外的语言中效果较差,但其放射学性能尚未得到广泛研究。
目的:本研究旨在调查使用 GPT3.5-turbo (GPT3.5) 的放射学报告对 TNM 分类的准确性以及多语言 LLM 在日语和英语中的效用。
材料和方法: 利用 GPT3.5,我们开发了一个系统,可以从肺癌的胸部 CT 报告中自动生成 TNM 分类并评估其性能。我们使用广义线性混合模型统计分析了在两种语言中提供完整的或部分 TNM 定义的影响。
结果:使用英文的完整 TNM 定义和放射学报告(M = 94%,N = 80%,T = 47% 和 ALL = 36%