ChatGPT上线一周年：AI如何改变医疗健康领域的未来？

最新推荐文章于 2025-12-03 22:49:17 发布

原创

最新推荐文章于 2025-12-03 22:49:17 发布 · 1.4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#chatgpt #人工智能

2022年ChatGPT的出现引领了人工智能在医疗领域的突破，如通过医学考试、医疗大模型Med-PaLM和MedGPT的发展，微软和Nuance的AI临床软件，以及在科研和诊断中的应用。文章详细探讨了这些技术如何改变医疗实践和未来发展趋势。

2022年11月30日，美国人工智能公司OpenAI发布了一款名为ChatGPT的大型语言模型，引发了全球的关注和热议。ChatGPT不仅能够与人类进行流畅的对话，还能根据用户的输入生成各种类型的文本，如诗歌、故事、代码、论文等。ChatGPT的出现，被认为是人工智能领域的一次重大突破，也为各行各业带来了新的机遇和挑战，尤其是在医疗健康领域。

在ChatGPT上线的第一周年之际，让我们回顾一下过去一年中，ChatGPT在医疗健康领域的一些重要事件和影响。

一、ChatGPT通过了美国医学执照考试（USMLE）

2月9日，在《PLOS数字健康》上的一项研究表明，由OpenAI创建的大型语言模型ChatGPT能够在美国医学执照考试（USMLE）中达到或接近60%的通过门槛。USMLE是美国医生执业资格的必要条件，包括四个部分，涉及基础医学知识、临床技能和临床知识等。研究人员对2022年6月USMLE发布的376个公共问题中的350个问题进行了测试，在去除基于图像的问题后。ChatGPT在三次考试中的得分率从52.4%到75.0%不等，合格门槛约为60%。该软件的回答也显示出94.6%的一致性，并在88.9%的回答中提供了至少一个重要的见解。

这一成就，显示了ChatGPT在医学领域的强大能力，也为医学教育和医疗服务提供了新的可能性。例如，ChatGPT可以作为医学生和医生的学习助手，提供个性化的教学和辅导，也可以作为医疗咨询和诊断的工具，为患者和医生提供专业的建议和参考。

二、谷歌发布了医疗大模型Med-PaLM2

Med-PaLM是基于ChatGPT的改进版本，专门针对医疗领域的数据和任务进行了优化和训练。Med-PaLM可以处理多种类型的医疗数据，如电子病历、医学图像、医学文献等，也可以完成多种类型的医疗任务，如病情预测、诊断推理、药物发现等。

根据《华尔街日报》消息，今年 4 月起，谷歌的医疗大模型 Med-PaLM2 已在美国梅奥医院（Mayo Clinic）等医疗机构进行实测。Med-PaLM2 是第一个在 MedQA 测试集中达到“专家”水平的 AI 大模型。2023年7月12日，谷歌和谷歌旗下人工智能公司DeepMind的研究人员在Nature上发表一项研究，提出了MultiMedQA评估基准，用于评测大语言模型在临床知识方面的表现，还详解了谷歌医疗大模型Med-PaLM的进化过程。结果研究人员发现，大语言模型构建的AI医生在很多方面与人类医生相当。

Med-PaLM 2 在美国医疗执照考试（USMLE）的MedQA 数据集上得分达到 86.5%，比前一代 Med-PaLM 提高了 19%以上。在 1000 多个实际医疗场景问答中，MedPaLM 2 在 9 项基准测试中，有 8 项表现良好，相较于人类医生回答更受认可。和普通医生的回答相比，MedPaLM 2 有 72.9%的回答被认为是和医生回答相对一致的。这表明，Med-PaLM已经达到了医学领域的专家水平，可以为医疗决策和研究提供强有力的支持和辅助。

三、微软收购了Nuance，推出了基于GPT-4的AI临床笔记软件

2022年3月，微软以 197 亿美元完成对Nuance的收购，Nuance是一家专注于医疗和企业领域的语音技术公司，其产品包括Dragon Medical One（一款医疗语音识别软件）和DAX（一款AI临床笔记软件）等。微软收购Nuance的目的，是为了加强其在医疗领域的布局和竞争力，也是为了利用其与OpenAI的合作关系，将GPT-4这一最先进的语言模型集成到Nuance的产品中。

2023年5月，微软和Nuance联合发布了一款基于GPT-4的AI临床笔记软件，名为DAX 2.03。DAX 2.0可以通过语音或文本的方式，自动记录和生成医生和患者之间的对话内容，以及医生的诊断和治疗计划等，从而减轻医生的文书负担，提高工作效率和质量。DAX 2.0也是医疗行业第一款结合GPT-4模型的应用，展示了语言模型在医疗领域的巨大潜力和价值。

四、医联推出了第一个国产医疗大模型MedGPT

2023年5月，医联宣布推出了第一个国产医疗大模型MedGPT。MedGPT是基于ChatGPT的改进版本，专门针对中文的医疗数据和任务进行了优化和训练。医联方面表示，medGPT采用大模型技术，基于医疗知识图谱为模型提供丰富，准确，结构化的医疗知识，并收集整理接近20亿条真实医患沟通对话，检验检测和病例信息进行深度训练学习，同时利用医生真实反馈进行强化学习，用以保障模型的推理质量，准确性与可靠性。

医联medGPT首次突破了AI医生无法与真实患者连续自由对话的难点，并在医疗问诊场景中支持多模态的输入和输出，在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。

为了验证MedGPT的性能，医联与四川大学华西医院进行了合作，对比了MedGPT和华西医院的专家医生在回答医学问题方面的表现。结果显示，MedGPT的平均得分为88.7%，而华西医院的专家医生的平均得分为89.3%，两者相差不大。这说明，MedGPT已经达到了国内医学领域的专家水平，可以为中国的医疗决策和研究提供高效和可靠的服务和辅助。

五、PubMed上关于ChatGPT的医学论文指数级增长

两位来自美国的医学教授于2023年9月6日在Cureus杂志发文表示，ChatGPT在医学文献中的指数级增长，截至 2023 年 8 月已累计超过1000篇。这些论文涵盖了从基础医学，到临床医学，到公共卫生，到医学教育等各个方面，展示了ChatGPT在医学科研中的多样性和广泛性。这些论文不仅展示了ChatGPT的能力，也表明了它对医学界的影响，以及对患者护理和医疗保健系统的贡献。