本文是LLM系列文章,针对《Enhancing Diagnostic Accuracy through Multi-Agent Conversations:
Using Large Language Models to Mitigate Cognitive Bias》的翻译。
概要
背景
临床决策中的认知偏差会显著导致诊断错误和患者预后不佳。解决这些偏见在医学领域是一项艰巨的挑战。本研究探讨了大型语言模型(LLM)在利用多智能体框架减轻这些偏见方面的作用。我们通过多智能体对话模拟临床决策过程,并评估其在提高诊断准确性方面的功效。
方法
从文献中找出16例已发表和未发表的认知偏差导致误诊的病例报告。在多智能体系统中,我们利用GPT-4 Turbo促进四个模拟智能体之间的交互,以复制临床团队动态。每个代理人都有不同的角色:1)在考虑讨论后做出初步和最终诊断,2)魔鬼代言人和纠正确认和锚定偏见,3)讨论的导师和促进者,以减少过早闭合偏见,4)记录和总结研究结果。总共对80个模拟进行了初步诊断、顶部鉴别诊断和最后两个鉴别诊断的准确性评估。
结果
在总共80份评估初始诊断和最终诊断的回复中,初始诊断的准确率为0%(0/80),但经过多主体讨论,最高鉴别诊断的准确度增加到71.3%(57/80)