2022年11月30日,美国人工智能公司OpenAI发布了一款名为ChatGPT的大型语言模型,引发了全球的关注和热议。ChatGPT不仅能够与人类进行流畅的对话,还能根据用户的输入生成各种类型的文本,如诗歌、故事、代码、论文等。ChatGPT的出现,被认为是人工智能领域的一次重大突破,也为各行各业带来了新的机遇和挑战,尤其是在医疗健康领域。
在ChatGPT上线的第一周年之际,让我们回顾一下过去一年中,ChatGPT在医疗健康领域的一些重要事件和影响。
一、ChatGPT通过了美国医学执照考试(USMLE)
2月9日,在《PLOS数字健康》上的一项研究表明,由OpenAI创建的大型语言模型ChatGPT能够在美国医学执照考试(USMLE)中达到或接近60%的通过门槛。USMLE是美国医生执业资格的必要条件,包括四个部分,涉及基础医学知识、临床技能和临床知识等。研究人员对2022年6月USMLE发布的376个公共问题中的350个问题进行了测试,在去除基于图像的问题后。ChatGPT在三次考试中的得分率从52.4%到75.0%不等,合格门槛约为60%。该软件的回答也显示出94.6%的一致性,并在88.9%的回答中提供了至少一个重要的见解。
这一成就,显示了ChatGPT在医学领域的强大能力,也为医学教育和医疗服务提供了新的可能性。例如,ChatGPT可以作为医学生和医生的学习助手,提供个性化的教学和辅导,也可以作为医疗咨询和诊断的工具,为患者和医生提供专业的建议和参考。
二、谷歌发布了医疗大模型Med-PaLM2
Med-PaLM是基于ChatGPT的改进版本,专门针对医疗领域的数据和任务进行了优化和训练。Med-PaLM可以处理多种类型的医疗数据,如电子病历、医学图像、医学文献等,也可以完成多种类型的医疗任务,如病情预测、诊断推理、药物发现等。
根据《华尔街日报》消息,今年 4 月起,谷歌的医疗大模型 Med-PaLM2 已在美国梅奥医院(Mayo Clinic)等医疗机构进行实测。Med-PaLM2 是第一个在 MedQA 测试集中达到“专家”水平的 AI 大模型。2023年7月12日,谷歌和谷歌旗下人工智能公司DeepMind的研究人员在Nature上发表一项研究,提出了MultiMedQA评估基准,用于评测大语言模型在临床知识方面的表现,还详解了谷歌医疗大模型Med-PaLM的进化过程。结果研究人员发现,大语言模型构建的AI医生在很多方面与人类医生相当。

Med-PaLM 2 在美国医疗执照考试(USMLE)的MedQA 数据集上得分达到 86.5%,比前一代 Med-PaLM 提高了 19%以上。在 1000 多个实际医疗场景问答中,MedPaLM 2 在 9 项基准测试中,有 8 项表现良好,相较于人类医生回答更受认可。和普通医生的回答相比,MedPaLM 2 有 72.9%的回答被认为是和医生回答相对一致的。这表明,Med-PaLM已经达到了医学领域的专家水平,可以为医疗决策和研究提供强有力的支持和辅助。
三、微软收购了Nuance,推出了基于GPT-4的AI临床笔记软件
2022年3月,微软以 197 亿美元完成对Nuance的收购,Nuance是一家专注于医疗和企业领域的语音技术公司,其产品包括Dragon Medical One(一款医疗语音识别软件)和DAX(一款AI临床笔记软件)等。微软收购Nuance的目的,是为了加强其在医疗领域的布局和竞争力,也是为了利用其与OpenAI的合作关系,将GPT-4这一最先进的语言模型集成到Nuance的产品中。
2023年5月,微软和Nuance联合发布了一款基于GPT-4的AI临床笔记软件,名为DAX 2.03。DAX 2.0可以通过语音或文本的方式,自动记录和生成医生和患者之间的对话内容,以及医生的诊断和治疗计划等,从而减轻医生的文书负担,提高工作效率和质量。DAX 2.0也是医疗行业第一款结合GPT-4模型的应用,展示了语言模型在医疗领域的巨大潜力和价值。
四、医联推出了第一个国产医疗大模型MedGPT
2023年5月,医联宣布推出了第一个国产医疗大模型MedGPT。MedGPT是基于ChatGPT的改进版本,专门针对中文的医疗数据和任务进行了优化和训练。医联方面表示,medGPT采用大模型技术,基于医疗知识图谱为模型提供丰富,准确,结构化的医疗知识,并收集整理接近20亿条真实医患沟通对话,检验检测和病例信息进行深度训练学习,同时利用医生真实反馈进行强化学习,用以保障模型的推理质量,准确性与可靠性。
医联medGPT首次突破了AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。
为了验证MedGPT的性能,医联与四川大学华西医院进行了合作,对比了MedGPT和华西医院的专家医生在回答医学问题方面的表现。结果显示,MedGPT的平均得分为88.7%,而华西医院的专家医生的平均得分为89.3%,两者相差不大。这说明,MedGPT已经达到了国内医学领域的专家水平,可以为中国的医疗决策和研究提供高效和可靠的服务和辅助。
五、PubMed上关于ChatGPT的医学论文指数级增长
两位来自美国的医学教授于2023年9月6日在Cureus杂志发文表示,ChatGPT在医学文献中的指数级增长,截至 2023 年 8 月已累计超过1000篇。这些论文涵盖了从基础医学,到临床医学,到公共卫生,到医学教育等各个方面,展示了ChatGPT在医学科研中的多样性和广泛性。这些论文不仅展示了ChatGPT的能力,也表明了它对医学界的影响,以及对患者护理和医疗保健系统的贡献。

2022年ChatGPT的出现引领了人工智能在医疗领域的突破,如通过医学考试、医疗大模型Med-PaLM和MedGPT的发展,微软和Nuance的AI临床软件,以及在科研和诊断中的应用。文章详细探讨了这些技术如何改变医疗实践和未来发展趋势。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



