大模型踏入医疗行业与人类医生一较高下时,它能达到什么水平?
就在最近,医学顶刊BMJ便给出了这样一个结论:
在遵循公认的临床抑郁症治疗标准方面,先进大模型可能比医生要强!
从研究结果上来看,大语言模型(LLM)在轻度和重度抑郁症治疗方面,已经达到了公认的治疗标准。
不仅如此,它们还不会被患者的外在因素所影响(包括性别、社会阶层等等),这就比人类初级医生还要强上一点了。
这是否就意味着类LLM选手们现在可以“持证上岗”了呢?
非也,非也。
考虑到抑郁症治疗的持续性和患者病情的多样性,这项研究认为,真正的治疗过程还是需要人类医生来进行。
不过研究同样指出,LLM对于现阶段医疗可以起到辅助决策的帮助:
有可能加强初级卫生保健的决策,提高精神卫生服务的质量和公正性。
毕竟自从LLM热潮以来,包括谷歌在内的众多AI玩家,都致力于推动其在医学领域中的作用。
甚至像“男孩阅医无数,最后竟被AI成功诊出病因”这样的新闻也是频频被曝出。
那么问题来了——LLM在现实中的医疗领域,到底走到了哪一步?
LLM,已然深扎医疗
一直以来,医疗行业都被视为AI落地的重要领域。
在深度学习浪潮刚刚兴起之时,深度学习三巨头之一Hinton就说出了名言:
5年内AI可以取代放射科医生。
尽管这个表达有些激进,但它揭露了一个事实,至少在科研层面,AI和医疗的结合是非常被看好的。
在过去一段时间以来,AI医疗场景不断开拓,比如利用CV算法识别病灶、检测心电图等。科技巨头们都紧跟趋势,如微软、谷歌、IBM等都在持续投入资金,推进AI医疗落地。
尤其在ChatGPT趋势到来以后,LLM更强的学习能力、更好的迁移能力以及更深的理解能力,都为AI医疗落地打开新局面。
而且这会是一个很确定的趋势,因为技术、应用落地和行业发展都准备好了。
首先技术方面,今年是大模型爆发的一年,目前国内已经形成“百模大战”格局。
诸多大模型厂商都主打To B路线,正在加速推动大模型在各个行业的应用。还有一些厂商直接推出面向医疗的行业大模型,所以对于医疗领域而言,当下是不缺“模”的。
其次,大模型和医疗领域也天生非常契合。
在常见的问诊、病历生成、患者病史分析等场景,都需要医生基于历史信息进行整合总结、分析判断,这正是大模型的长项。
比如利用大模型的总结摘要能力,可以快速对多类数据进行总结并形成摘要,帮医生完成繁琐、重复性高的工作,提升效率。
并且实际落地上,只需以基座大模型为底,应用专业医疗数据训练,就能得到一个强大的医疗大模型,这能从根本上加速AI医疗落地。还能在一个系统中集成多个子模型,即可快速覆盖更多场景。
再来看行业发展方面,以国内情况为例,数字化医疗、AI医疗逐渐发展为一个独立赛道,玩家们利用数据分析、自然语言处理(NLP)、结构化数据等技术,已经成功将AI引入临床诊断决策、病例数据管理等。
简单理解,这是一个能优化医院看诊、决策、预警、管理等方面的智能应用,核心目标就是让医院数字化系统运行更加丝滑流畅,提高医生诊疗效率。
它主要融入了PDCA过程管理和CDSS(临床决策支持系统)。利用机器学习、深度学习、大数据挖掘等技术,可以智能识别分析病历文书、LIS/RIS报告等患者完整病历数据;为医院构建专门的医学知识库;给医生、医技、护士、管理方提供实时智能参考与建议。
综上,医疗大模型应用落地路径已经比较明确。但是落地的过程却没有想象中的那般容易。
医疗大模型落地,怎么解?
AI大模型与医疗结合,首先需要保障患者的数据安全。
有学者表示,医院的数据,具有协同与共享需求大、敏感信息多、数据价值高等特点,各种因素导致的攻击、泄露都可能给医院带来不可估量的损失。为此,医院需要建立数据管理制度,这其中,一方面要解决数据资产的梳理、纳管,以及医院数据的分类分级;另一方面,还要针对医院不同数据场景需求的数据安全管控、监测规范和数据合规使用的流程,将技术与管理流程相结合。
“此外,基于医院有大量工作需要依托数据开展以及监管部门的紧急数据上报任务等,相关部门的协同尤为重要;而数据共享的风险监测、脱敏保护、合规使用等,也需要从技术保障层面给予数据安全一定助力。”
现阶段,医疗健康领域各责任主体按照《“十四五”全民健康信息化规划》《国家健康医疗大数据标准、安全和服务管理办法(试行)》等文件的要求,推进数据应用服务及安全管理。
其次,AI大模型与医疗的结合的优劣,还需纳入相关标准。有学者表示,评价维度涉及多方内容,首先,应该重点关注不同的医疗场景下大模型的精度、准确性,通过行业测试问题集,结合医生评价,对大模型实际应用结果进行评估验证。
其次,应关注个人信息保护和数据安全,针对数据采集、预处理、使用及管理提出全流程的规范化要求,并围绕内容可靠性、内容合规性及价值观对齐三方面,确保生成内容的安全可靠。最后,大模型的可扩展性、鲁棒性也是评价大模型服务能力的关键点。
再次,可能存在的内容虚假和错误,以及收费制度也将成为AI大模型的落地阻碍。
学者认为,一方面,AI大模型在医疗场景应用,还需兼顾安全性与专业性,对可能引起的内容虚假和错误要引起重视,“对于内容虚假和错误,控制数据质量(通过数据清洗、标注和验证等对规范数据质量提出量化要求)和及时开展算法检测和修正(确保模型决策透明、可解释、可追溯)等都是有效手段,而医院等主体加强监管,人工审核输出结果的方式仍十分有必要。”
另一方面,AI大模型的计算需要大量的算力作为支撑,而医院在算力部署等方面仍存在短板,轻量化、本地化部署的大模型,也是未来需要去挑战完成的。
“AI大模型与医疗结合的定位尚处于辅助智能阶段,评价标准、收费制度等往往较为滞后。比如,AI大模型如果要以辅助诊疗方式进入某家医院成为收费项,会涉及新技术准入评估如临床有效性、安全性、卫生经济学评价,以及定价等环节。这都会直接影响推广性、复制性。”
医疗大数据是医疗大模型开发的数据底座,在医疗领域,数据质量与成本问题、数据共享与安全问题、数据脱敏问题等更为复杂。国家卫健委等10部门于2024年2月发布的《关于加强医疗监督跨部门执法联动工作的意见》就提出,要借助新兴技术,加强业务协同,打通信息壁垒,实现数据共享互通,破除“信息孤岛”。而北京市此次《行动计划》中关于实施医疗大数据共享与应用,以及保障和促进医疗数据安全跨境流动的建议,或许能为解决医疗大数据的痛点提供借鉴。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】
