Trustworthy Medical Imaging with Large Language Models: A Study of Hallucinations Across Modalities

医学影像中大模型幻觉研究

一、文章主要内容

该研究聚焦大型语言模型(LLMs)在医学影像领域应用中的“幻觉”问题,从“图像到文本”和“文本到图像”两个方向展开系统分析,旨在提升LLM驱动医学影像系统的安全性与可信度。

1. 核心背景与问题

LLMs在医学影像任务(如影像解读、合成影像生成)中应用日益广泛,可辅助生成放射报告、助力医学教育等,但常产生“幻觉”——即自信却错误的输出,可能误导临床决策。例如在脑部MRI解读中,若LLM误判中线偏移程度,可能低估危及生命的病情;在生成影像时,若按提示生成含6mm中线偏移的MRI却出现解剖错误,会影响医学教育与诊断模型训练。

2. 研究方向与分析内容

  • 图像到文本(影像解读):评估LLM对胸部X光、CT、脑部MRI等多模态影像的解读能力,重点分析事实矛盾、解剖不准确等错误。如检测胸腔积液时,不同LLM对积液位置(左侧、右侧、双侧)和严重程度(轻度、中度、重度)的判断存在差异,部分模型甚至漏判;在腹部CT中检测腹水时,对细微积液或与其他低衰减结构的区分能力不足,易出现“幻觉”或漏检。
  • 文本到图像(影像生成):考察LLM根据临床提示生成医学影像的忠实度,发现两类典型“幻觉”:一是引入未提示且无临床意义的视觉元素(如生成含胸腔积液的胸部X光时,默认固定一侧,或生成术后腹部CT时额外添加手术夹);二是生成解剖或临床不合理内容(如按提示“生成含脚趾骨折的胸部X光”,GPT-4o错误叠加手指骨骼,而Gemini-2.5 Flash虽生成正确的胸部和足部X光但需额外澄清)。
要根据Yandex TIC资源排名算法及TIC计算原则(入站链接数量、链接质量、主题相关性)生成图,可以使用Python的`matplotlib`和`networkx`库。以下是一个示例代码,用于创建一个简单的有向图来表示这些关系: ```python import networkx as nx import matplotlib.pyplot as plt # 创建一个有向图 G = nx.DiGraph() # 添加节点 G.add_node("目标资源", color='red') G.add_node("入站链接1", color='blue') G.add_node("入站链接2", color='blue') G.add_node("入站链接3", color='blue') # 添加边,表示入站链接到目标资源 G.add_edge("入站链接1", "目标资源", weight=2, theme_relevance=0.8) G.add_edge("入站链接2", "目标资源", weight=3, theme_relevance=0.6) G.add_edge("入站链接3", "目标资源", weight=1, theme_relevance=0.9) # 节点颜色 node_colors = [G.nodes[node]['color'] for node in G.nodes()] # 绘制图 pos = nx.spring_layout(G) nx.draw_networkx_nodes(G, pos, node_color=node_colors) nx.draw_networkx_edges(G, pos) nx.draw_networkx_labels(G, pos) # 显示边的权重(链接质量)和主题相关性 edge_labels = {(u, v): f"质量: {d['weight']}, 相关性: {d['theme_relevance']}" for u, v, d in G.edges(data=True)} nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels) plt.title("Yandex TIC资源排名相关图") plt.show() ``` 在这个示例中,创建了一个有向图,其中“目标资源”是要排名的资源,其他节点表示入站链接。边的权重表示链接质量,同时还添加了主题相关性的信息。通过`matplotlib`库将图可视化。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值