来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~
多模态医学图像正沿着“图像采集-质控→核心处理→特征分析→临床落地”螺旋式升级,CVPR 2025与MICCAI 2025收录量激增,3D CT/MRI与文本、EHR的跨模态对齐成为顶会爆点。
如何在3D-RAD的136K问答、HSENet的双路径空间编码、Brain-Adapter的轻量瓶颈之间快速定位可迁移创新,成为投稿胜负手。
本文结合最新进展,帮你梳理分割/配准/融合、特征融合与分类、以及临床部署三大环节的热点,助你高效设计实验:
3D-RAD: A Comprehensive 3D Radiology Med-VQA Dataset with Multi-Temporal Analysis and Diverse Diagnostic Tasks
方法:这篇文章首次推出 3D-RAD,一个面向 3D 放射科 CT 的大规模医学视觉问答数据集,通过半自动报告解析、专家校验与 GPT-4o-mini 评分过滤构建 136K 高质量问答对,并设计六类任务以开放/封闭题型全面评测模型在异常检测、影像观察、医学计算、存在判断、静态时序诊断与纵向时序诊断上的能力,同时提供 3D-RAD-T 训练子集供领域微调。

创新点:
-
首次将 3D 体积 CT 引入 Med-VQA 并支持多时序推理,突破以往 2D 切片局限。
-
提出静态与纵向两种时序诊断任务,让模型仅凭单图或结合历史标

最低0.47元/天 解锁文章
2383

被折叠的 条评论
为什么被折叠?



