【影诊AI】四种AI智能工具辅助医学影像诊断能力对比分析

起因是写MRS实战文章时需要查找一些资料,用搜索引擎查找发现很难匹配,顺便就用AI智能工具查下,结果兴趣越来越高,查了小半天并用很多语句、图片、报告来检测工具能力,顺手就写了这篇文章。个人色彩浓厚,纯纯的好玩,结论别太在意。

原来计划四个AI工具,因为Chatgpt不允许国内使用,标题不修改了,待未来允许后,重新评估。

本篇文章枯燥冗长,对过程不感兴趣的直接跳到结论看看即可,总之,医学AI工具未来之路非常漫长,远非现在所推崇的能力水平。一家之言,别当真。

目的:利用四种AI智能工具观察并分析

工具:DeepSeek、ChatGpt、豆包、Kimi

方法:输入文字或图片,查看分析过程或直接看分析结论。

1、查看搜索能力

关键词如下:MRS、Magnetic Resonance Spectroscopy、MRS图像及各峰解析

关键词依次是模糊、准确、精准,主要考验AI工具的搜索准确度、匹配度、问题的广度及深度。

2、查看翻译能力

双侧膈下未见游离气体密度影。腹腔内及盆腔内见少量肠气及肠内容物存留;双肾轮廓影可见。双肾区、输尿管走行区及膀胱区未见阳性结石征象。所见腰椎序列规整。

双侧膈下未见游离气体密度影及腹部未见阳性结石征象。

以上是一句最常见的腹部平片报告中文,翻译成英文对于AI工具不是难事,重要的是其中专业性的翻译文法,比如阳性结石征象Positive signs of stone or calculi,膈下subphrenic,以及最后结论的简洁程度,考验AI工具的医学专业水准。

3、人工报告与智能报告的对比,并反馈给AI助手,看它的反应

您好像翻译不那么精准,将xx替换为xx怎么样?

对比我修改的英文报告和您翻译的英文报告区别

以上两句话是判断AI工具的自我认知和学习能力,能否意识到两种翻译的区别,能否在进行类似的翻译时自我修改更为符合我翻译习惯的文字。

4、查看查找制作医学影像专业课的能力并中英文翻译

查找带有汉字“气”的疾病并用英文制作一篇PPT医学影像课,包括疾病名称,影像图片,描述,疾病影像特征,治疗方法

这个就有难度了,考验AI工具的搜索、查询、分析、翻译、医学专业水准、生成专业文件的能力。其中带有“气“的疾病,最常见的气胸、液气胸、血气胸、腹腔积气、门静脉积气、胆管积气、气颅、颅内积气、膀胱积气、胆囊积气等,最为特殊的考验AI的是“小肠疝气“类似的口语性质的疾病名称。

5、给出影像图片和病史,看分析结论

桡骨中段骨折DR正侧位片分析

本例给出病史,考验AI工具的分析影像、书写报告的能力。已经很难了。

结肠癌并肝转移,胆囊结石CT影像分析

本例不给病史,直接考验AI诊断的能力;后期补充病史,看自我修正的能力。最后给出报告结论。

6、上一题给出描述和报告,如果医学伦理学受限,给出描述即可。

因医学伦理学受限,AI智能工具可能认为设定不允许随意给出医学类建议,我们设定医学伦理学受限,给出描述即可,无需结论及治疗方案。

过程:比较冗长,图片多,英文多,不感兴趣的直接跳到结论即可。

DeepSeek篇

1、查询 MRS,非常精准,直接定位到磁共振波谱MRS以及其他的领域。★★★★★

查询Magnetic Resonance Spectroscopy,非常精准,★★★★★

查询MRS图像及各峰解析,非常精准,关键是以对比图表的方式给出结论,这个非常好,超过其他AI,★★★★★★。

2、直接翻译给出的英文报告

提示工具翻译不精准,并给出subphrenic膈下的,非常专业的英文词语,看AI的回复。

关于我的修改报告和AI报告的对比分析,看AI的回复。

3、查找汉字带有“气“的疾病,并制作ppt英文版,涉及西医、中医领域。第一次查询只给出3种病例。

提示要看更多的病例后,给出6种,好多的病种都没有列出来。

4、根据DR和病史,给出报告结论,诊断完全错误,一星。

给出提示是尺骨还是桡骨后,看AI的回复。

5、直接给出结肠癌、肝转移、胆囊结石的患者CT平扫图片,没有给出病史,看AI的回复

报告结论提示正常,继续提示深度思考后,看AI的回复。

报告结论依然是未见异常,再次提示并给出结肠癌病史,看回复。

AI只给出结肠癌的确切诊断,淋巴结肿大,可能的肝转移,没有胆囊结石。继续让AI自己分析报告对比分析,并询问AI的诊断水平,看回复。

豆包篇

1、查询MRS,非常精准定位磁共振波谱,五星。

查询Magnetic Resonance Spectroscopy,非常精准。

查询MRS图像及各峰解析,第一次查询结果完全是错误的,给出无关的一些图像。一星。

第二次给出的提示是“查询MRS的典型图像及各峰解析”,非常精准。

2、直接翻译报告。

提示翻译不精准,给出替换提示。

继续提示,故意打错一个词,看AI的回复。

对比分析给出结论,看回复。

3、查找带有汉字“气”的疾病查询结论,制作ppt,看回复,一共给出5种疾病。

提示给出更多疾病,给出6种,包括中医的湿气重,看回复。

4、给出DR图片和病史,看AI的诊断回复。

询问AI是否肯定诊断的回复。

5、给出结肠癌CT平扫的图片,未给病史,看AI的诊断

提示未见异常后,再次询问AI结论是否正确,看回复。

给出病史信息后,看回复。给出的是中文,忘了英文这回事。

给出的是中文报告,提示翻译英文报告

报告结论给出结肠癌,肿大淋巴结、肝转移的诊断,没有胆囊结石。

对比报告分析,给出对自己的诊断水平评价,看回复。

Kimi篇

1、查询 MRS,完全不对

查询Magnetic Resonance Spectroscopy,非常精准,英文的

查询MRS图像及各峰解析,精准,英文

2、直接翻译英文

提示替换后,看回复

继续提示

AI对比分析的结论

3、查找“气”疾病,给出6种病,包括少见的疝气,以ppt格式给出。

4、DR诊断,非常意外,完全正确

继续询问骨折分型

5、结肠癌CT平扫诊断

结论未见异常

继续提醒深度思考

结论依然未见异常,给出病史,看回复

AI对比前后报告分析

分析:

以下分析完全带有个人色彩和偶然性,不要当真。

1、查看搜索能力

关键词如下:MRS、Magnetic Resonance Spectroscopy、MRS图像及各峰解析

关键词依次是模糊、准确、精准,主要考验AI工具的搜索准确度、匹配度、问题的广度及深度。

查询MRS,DeepSeek、豆包完全精准;kimi完全错误,给出夫人等搜索引擎最常见的结论。

Magnetic,DeepSeek、豆包完全精准;Kimi非常精准,但是给的是英文的内容。

图像及各峰解析,DeepSeek精准,并以对比图表方式给出结论,非常好;豆包第一次查询完全错误,给出很多无关的图像,再次提示后给出精准答案。kimi精准,但是英文内容。

2、查看翻译能力

双侧膈下未见游离气体密度影。腹腔内及盆腔内见少量肠气及肠内容物存留;双肾轮廓影可见。双肾区、输尿管走行区及膀胱区未见阳性结石征象。所见腰椎序列规整。

双侧膈下未见游离气体密度影及腹部未见阳性结石征象。

3、人工报告与智能报告的对比,并反馈给AI助手,看它的反应

您好像翻译不那么精准,将xx替换为xx怎么样?

对比我修改的英文报告和您翻译的英文报告区别

以上两句话是判断AI工具的自我认知和学习能力,能否意识到两种翻译的区别,能否在进行类似的翻译时自我修改更为符合我翻译习惯的文字。

以上是一句最常见的腹部平片报告中文,翻译成英文对于AI工具不是难事,重要的是其中专业性的翻译文法,看英文报告模式和内容基本符合语法标准、内容是否有错误。给出beneath/under the diaphragm替换为更为专业的subphrenic,No evidenct of radiopaque calculi 替换为No positive signs of calculi后,豆包和kimi打错一个单词evidence替换为evidenct,看修改的报告和对比两次报告的分析。

DeepSeek翻译内容符合语法习惯,报告内容没有错误,报告格式,给出替换提示后,直接替换,给出对比报告分析中肯。

豆包基本符合语法,报告内容没有错误,更为精炼,报告格式,给出替换提示后,直接替换,发现错误的单词,给出对比报告分析中肯。

kimi基本符合语法,报告内容没有错误,更为精炼,没有按报告格式给出,给出替换提示后,直接替换,没有发现错误的单词,给出对比报告分析中肯。

DeepSeek和豆包按报告格式给出英文报告;kimi没有给出报告格式;内容都中规中矩,简洁程度不同,对比分析能意识到自己的不足,并修改。

豆包和kimi打错的单词,豆包及时发现并更正,kimi没有发现,DeepSeek没有给出错误单词,无需评价。

4、查看查找制作医学影像专业课的能力并中英文翻译

查找带有汉字“气”的疾病并用英文制作一篇PPT医学影像课,包括疾病名称,影像图片,描述,疾病影像特征,治疗方法

这个就有难度了,考验AI工具的搜索、查询、分析、翻译、医学专业水准、生成专业文件的能力。其中带有“气“的疾病,最常见的气胸、液气胸、血气胸、腹腔积气、门静脉积气、胆管积气、气颅、颅内积气、膀胱积气、胆囊积气、湿气、气腹等,最为特殊的考验AI的是“小肠疝气“类似的口语性质的疾病名称。

基本都搜索3-6种疾病,可按ppt模式制作报告文字。但是对于搜索的内容,除了kim搜索查到疝气这个特殊的诊断让我惊讶一点,坦白讲,非常不满意。搜索是AI工具的基本要求,但是从最后所有工具的结论来看,及格线都达不到,一名普通影像医生的认知都包含这么多常见的含“气”的疾病诊断,作为一个功能强大的AI这些疾病大部分都没有提及,非常遗憾。

5、给出影像图片和病史,看分析结论

桡骨中段骨折DR正侧位片分析

本例给出病史,考验AI工具的分析影像、书写报告的能力。已经很难了。

DeepSeek和豆包诊断完全错误,桡骨中段骨折,给出的是尺骨中段骨折。

kimi诊断准确,具体问疾病分型,给出的Colles骨折,正常的答案给出粉碎性骨折就可以了,所以还是不及格。

结肠癌并肝转移,胆囊结石CT影像分析

本例不给病史,直接考验AI诊断的能力;后期补充病史,看自我修正的能力。最后给出报告结论。

直接给出CT图像并没有给出病史时,三种AI工具答案完全错误;

给出结肠癌提示后,三种AI工具答案完全给出结肠癌、区域性淋巴结转移、可能肝转移报告结论,其中kimi很惊艳的给出结肠肝曲的解剖部位提示,但是三种工具都没有给出胆囊结石的结论,明晃晃的一个图像表现。

6、上一题给出描述和报告,如果医学伦理学受限,给出描述即可。

因医学伦理学受限,AI智能工具可能认为设定不允许随意给出医学类建议,我们设定医学伦理学受限,给出描述即可,无需结论及治疗方案。

三种工具都没有提及医学伦理学问题,这个所有的AI工具未来要考虑加进去,因为医学伦理学对于某些疾病的诊断带有回避色彩的,可以不回答,或者给出描述,没有结论。

结论:

首先声明一点,kimi在前几天笔者曾经发给一本中英文报告书写的书籍,可能在深度学习后给出了不同的答案。

三种AI工具在搜索、查询具体问题时具有无与伦比的能力,查询内容精准、详实,远超现在的各种搜索引擎,但是对于具体文字“查找MRS图像和各峰解析”理解上,DeepSeek和kimi优于豆包,可能文字给出歧义;

三种AI工具在查找带有“气”的相关疾病上,表现相差无几,显示疾病的数量、名称明显少于笔者这个普通的影像医生的认知,查找的内容详实、准确,对于小肠疝气这个疾病,kimi很奇怪能给出,比较惊讶。

中译英影像报告,符合基本语法要求,内容没有错误,但是对于某些专业性极强的词语,对于报告结论的简洁程度上,三种工具有明显的缺失,对于专业性的内容,相信未来可以不断提升,但是对于影像报告的简洁程度把握上,估计要有个性化的差异。

对于给出骨折病史的DR的诊断,选择前臂DR就是因为尺桡骨容易混淆,人都容易犯错的问题,DeepSeek和豆包完全犯了同样的错误,发现了骨折,诊断错了,kimi很惊艳的诊断正确。

对于结肠癌的CT图片,没有给出病史的时候,三种工具诊断完全错误;给出病史,都提及了结肠癌、肝转移瘤、区域性淋巴结转移,但是kimi给出了结肠肝曲的具体解剖部位,相对略高一筹。但是都漏了明晃晃的胆囊结石,这个错误,无比巨大。

从笔者从业经验来看,肺结节、冠脉诊断、骨龄筛查,这些已经深度投入并取得了一定的结果,尤其是肺结节筛查,非常具有医学辅助诊断助手的能力,假阴性和假阳性虽然多,但是是一个重要的参考。

从这篇文章的测试结论来看,搜索、查询AI工具具有非常强大的实力,这个毋庸置疑,人赶不上。但是对于医学影像的专业性诊断,AI工具还有非常非常长的一段路要走,对于报告的结论的医学伦理学要求,AI工具要主要教育和培养这种意识,避免出现患者拿着AI工具的诊断报告和医生来争论的场景。

AI智能诊断,网上炒的很火,现在更多的是一种虚假的繁荣,需要时间、精力、经验来逐步培养,一点点的提升,如果有专业的医学模型投入,相信未来AI诊断精度会有巨大的提升。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值