自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(390)
  • 收藏
  • 关注

原创 一种用于术后吞咽功能分析的舌背 Cine-MRI 分割新方法

Cine-MRI 具有高时空分辨率且无辐射的优势,已成为评估头颈部肿瘤患者吞咽功能的新方法。然而,人工标注 Cine-MRI 影像的工作量较大,且存在主观性差异,影响结果的稳定性。本研究提出了一种基于改进 Cine-MRI 分割模型的吞咽分析方法,旨在自动计算吞咽过程中舌背运动参数,并进行定量分析,以减轻医生的工作负担并提高标注的鲁棒性。方法:舌背运动参数计算:基于人工标注的吞咽结构,提出计算舌背运动参数的方法,实现吞咽能力的定量分析。空间-时间混合模型。

2025-03-07 10:52:29 366

原创 使用基于深度学习的 T1 加权 MRI 个性化电场图直接估计 tDCS 数字孪生

经颅直流电刺激(tDCS)是一种非侵入性脑刺激方法,通过低强度直流电施加神经调节效应,在抑郁症、物质使用障碍、焦虑和疼痛等领域展现出潜在的积极影响。然而,混合试验结果阻碍了该领域的发展。电流场近似计算为tDCS研究人员提供了一种评估个体对特定tDCS参数响应的方法。尽管已有基于物理模型的公开刺激器推动了研究进展,但这些方法可能存在误差、对数据质量敏感(如分割错误),且运行时间较长(可达数小时)。实现数字功能孪生(Digital Functional Twin)理念,用于个性化tDCS响应预测。

2025-03-06 11:05:17 604

原创 迈向具有域通用可解释性的图神经网络,用于基于 fMRI 的脑部疾病诊断

图神经网络(GNNs)已成为基于功能磁共振成像(fMRI)数据诊断脑部疾病的前沿方法。然而,考虑到功能性脑网络的高复杂性以及不同临床中心fMRI数据的强变异性,GNNs 在可解释性和泛化性方面仍面临挑战。尽管已有许多研究分别探讨了GNNs的可解释性和泛化性,但很少有方法能够同时兼顾这两个方面。统一GNNs的可解释性与泛化性问题,并从可解释性的角度重新审视fMRI数据在脑疾病诊断中的领域泛化(DG)问题。目标是学习领域泛化的解释因子,以增强跨中心的图表示学习,从而提高脑疾病诊断的稳定性与准确性。

2025-03-06 10:54:15 658

原创 基于各向异性噪声的同步图像-标签扩散用于无对比剂 CT 的卒中病灶分割

在非对比增强CT(NCCT)影像上实现自动化脑卒中病灶分割对于提高卒中患者的诊断效率至关重要。尽管扩散概率模型(DPM)在多个领域取得了显著进展,但其在医学影像中的应用仍存在局限性,主要源于传统各向同性高斯噪声的使用。各向同性高斯噪声忽略了医学影像中的结构信息及强烈的体素依赖性,限制了模型的表现。针对上述问题,提出一种新的框架,该方法在图像-标签上同步执行扩散过程,并结合各向异性噪声采样策略,以提升NCCT影像上卒中病灶的分割性能。

2025-03-06 09:31:08 417

原创 以结构绕行表征功能连接:解读结构-功能耦合机制的新视角

现代神经影像技术为研究结构连接(SC)和功能连接(FC)提供了可能。然而,由于SC和FC在生物连接机制上的差异,现有的统计关联方法难以有效解析其耦合机制。本研究提出一种基于网络拓扑的新视角,以理解SC与FC的复杂关系,并探索其在认知状态演化中的作用。假设每个FC实例要么由SC的直接连接支持,要么由一组替代性SC路径协同维持,形成拓扑上的“绕行(detour)”概念。

2025-03-05 10:34:19 794

原创 用于动态脑网络分析的质量感知模糊最小-最大神经网络

动态功能连接(dFCs)在脑部疾病诊断中得到广泛应用。然而,现有的动态脑网络分析方法忽略了脑网络中的模糊信息,以及由于不同时间窗数据质量不一致所带来的不确定性,导致多时间窗的整合结果可能不够可靠。针对这一问题,提出了一种基于质量感知模糊最小-最大神经网络(QFMMNet)的动态脑网络分析方法,以提升dFCs的可靠性和诊断能力。将dFCs的单个时间窗视为一个视角,并在多视角学习框架下定义三种卷积滤波器,以从脑网络中提取特征,从而获取dFCs的多视角证据。

2025-03-05 10:17:00 205

原创 MetaAD:3D 18F-FDG PET 中帕金森病的代谢感知异常检测

多巴胺转运体(DAT)成像,如¹¹C-CFT PET,在帕金森病(PD)诊断中表现出显著的优势。然而,大多数医院无法获取DAT成像,而是依赖更常见的¹⁸F-FDG PET。然而,在视觉分析中,¹⁸F-FDG PET可能无法呈现PD的主要异常特征,从而影响计算机辅助诊断(CAD)的效果。针对这一问题,提出了一种代谢感知异常检测(MetaAD)框架,以突出¹⁸F-FDG PET扫描中与PD相关的代谢异常特征。

2025-03-05 09:53:23 253 1

原创 MEGFormer:通过扩展语义表示增强大脑活动的语音解码

近年来,多个研究利用非侵入性技术探索从大脑活动解码语音。然而,由于解码质量仍然不足,该任务在实际应用中仍面临挑战。一个有效的解码方案不仅可以促进脑机接口(BCI)的发展,为言语障碍患者提供沟通恢复的可能性,还能为理解大脑如何处理语音和声音提供基础性见解。本研究旨在改进基于脑磁图(MEG)的语音解码方法,以提升解码准确性,并增强对感知语音的建模能力。采用对比学习训练的自监督模型,以零样本(zero-shot)方式匹配MEG信号与音频片段。

2025-03-05 09:42:32 797

原创 Lifespan Brain MR 图像分割的知识引导式提示学习

在整个生命过程中,对脑部MR图像进行自动且精准的组织与结构分割,对于理解脑发育过程和疾病诊断至关重要。然而,由于早期脑发育的快速变化、衰老及疾病导致的复杂形态变异,以及手动标注数据的有限性,该任务面临诸多挑战。针对这些问题,提出了一种基于知识引导提示学习(KGPL)的两步分割框架,以提升脑部MRI分割的准确性和鲁棒性。该框架首先在大规模但标注质量欠佳的数据集上预训练分割模型,随后将从图像-文本对齐中学习到的知识驱动嵌入引入模型。

2025-03-04 11:56:54 867

原创 使用 Transformer 探索时空可解释动态脑功能用于脑疾病诊断

与脑部疾病相关的脑功能模块(BFMs)在时空组织模式上的动态变化仍不明确。为解决这一问题,提出了一种端到端的基于Transformer的框架,用于充分学习BFMs的时空特征,并探索与脑部疾病相关的可解释变化。该模型结合了监督引导的时空聚类策略,以自动识别具有动态时变权重的BFMs。此外,采用了具有拓扑感知投影的多通道自注意力机制,以充分挖掘时间变化特征并增强时空表征能力。在抑郁症(MDD)和双相情感障碍(BD)的诊断实验中,该模型实现了最先进的性能。

2025-03-04 11:42:57 306

原创 D-CoRP:功能性脑网络的可微分连接优化

脑网络是理解大脑的重要工具,为科学研究和临床诊断提供了关键见解。然而,现有的脑网络模型通常侧重于脑区本身,或忽略了脑连接的复杂性。此外,由MRI衍生的脑网络数据容易受到连接噪声的影响,这凸显了在脑网络建模中纳入连接信息的必要性。针对这一问题,提出了一种可微分模块用于优化脑连接结构。采用基于信息瓶颈理论的多变量优化方法,以应对脑网络的复杂性,并过滤噪声或冗余连接。此外,该方法可作为灵活的插件,适用于大多数图神经网络(GNN)。

2025-03-04 10:18:30 378

原创 用于脑疾病识别的定制关系图神经网络

大脑网络/图的连接结构能够揭示不同脑区之间的分离与整合模式。大量研究表明,特定的脑部疾病与某些脑区内部异常的连接模式相关。因此,已有多种图神经网络(GNN)模型被提出,以自动识别脑图中的异常整合模式。现有基于GNN的模型通常以统计特定指标构建脑网络/图,而这些输入结构无法被训练。这一局限可能导致模型在下游任务中的表现受限,从而影响最终结果。因此,提出了一种定制关系图神经网络(CRGNN),以弥合图结构与下游任务之间的差距,使模型能够根据具体任务动态学习最优的脑网络/图。

2025-03-03 18:17:56 272

原创 使用分割约束的超分辨率和表征学习从 2D MRI 中重建皮质表面

皮质表面重建通常依赖高质量的三维脑部MRI来构建大脑皮层结构,在揭示神经发育模式方面发挥着至关重要的作用。然而,在临床实践中,由于高昂的成本和较长的扫描时间,往往只能获得质量较低的二维脑部MRI,从而带来挑战。为优化临床数据在大脑皮层分析中的应用,提出了一种从二维脑部MRI图像重建皮质表面的两阶段方法。第一阶段采用分割约束的MRI超分辨率(SR),将超分辨率模型与皮质带分割模型相结合,以增强从二维输入生成的三维图像中的皮质区域。

2025-03-03 17:54:00 284

原创 BrainSCK:通过知识注入和再激活进行大脑结构和认知对齐以诊断脑部疾病

新兴的先进神经影像学研究证据表明,不同脑部疾病(BD)在整个人类生命周期中可能具有共同的神经基础。因此,研究人员旨在创建一个基于神经影像的大规模人群筛查诊断模型,用于多个脑部疾病的识别。现有的模型主要采用迁移学习范式,这些模型基于大规模但与任务关系较弱的外部数据预训练,或者基于健康人群大脑数据预训练,并使用辅助任务(如年龄预测)。前者对人群规模大脑数据中的个体间差异和与BD相关的特征识别较少,而后者则依赖于代理任务与BD任务之间的弱隐式关联。

2025-03-03 17:01:14 1019

原创 解剖学引导下 T1 加权和 T2* 加权 MRI 中脑微出血的分割

脑微出血 (CMB) 被定义为大脑中相对较小的血液沉积,作为小血管疾病的严重程度指标,因此准确量化 CMB 在临床上是有用的。然而,由于 CMB 的体积小且存在潜在的错误分类风险,因此手动注释对临床医生来说是一个极大的负担。此外,CMB 分割任务中固有的极端类不平衡对训练深度神经网络提出了重大挑战提出通过引入幕上和幕下区域分割的代理任务来提高 CMB 分割性能该代理任务可以利用临床先验知识来识别 CMB。

2025-02-28 10:15:24 385

原创 基于亲和力学习的脑功能表征用于疾病诊断

静息态功能磁共振成像 (rsfMRI) 是量化脑功能连接 (FC) 的有效手段,在诊断疾病方面具有潜力。然而,传统的 FC 措施可能无法概括大脑错综复杂的功能动力学;例如,通过 Pearson 相关计算的 FC 仅捕获来自不同大脑区域的信号之间的线性统计依赖关系。提出了一个用于建模 FC 的亲和力学习框架,利用预训练模型来辨别大脑区域之间的信息功能表示。采用随机采样的补丁并对其进行编码以生成区域嵌入,随后被提议的亲和力学习模块用于通过亲和力编码器和信号重建解码器推断任何一对区域之间的函数表示。

2025-02-28 10:06:54 416

原创 TaGAT:用于多模态视网膜图像融合的拓扑感知图注意力网络

在医学图像融合领域,整合来自各种模式的信息对于改进诊断和治疗计划至关重要,尤其是在视网膜健康方面,其中重要特征在不同的成像模式中表现出来不同。现有的基于深度学习的方法没有充分关注视网膜图像融合,因此无法在视网膜图像融合中保留足够的解剖结构和精细血管细节。提出了用于多模态视网膜图像融合的 TopologyAware Graph Attention Network (TaGAT)利用带有图注意力网络 (GAT) 的新型拓扑感知编码器 (TAE) 来有效增强视网膜脉管系统跨模态图形拓扑的空间特征。

2025-02-27 09:26:40 482

原创 RIP-AV:使用上下文感知网络进行视网膜动脉/静脉分割的联合代表性实例预训练

基于深度学习的视网膜动脉和静脉 (A/V) 准确分割可以改进眼底疾病和全身性疾病的诊断、监测和管理。然而,由于背景与 A/V 比率不平衡和上下文有限,现有的调整大小和基于贴片的算法面临着冗余、忽略薄血管以及在视网膜图像的低对比度边缘区域表现不佳等挑战。开发了一种用于视网膜 A/V 分割的新型深度学习框架,名为 RIP-AV,它首次将代表性实例预训练 (RIP) 任务与用于视网膜 A/V 分割的上下文感知网络集成在一起。

2025-02-26 11:25:59 1066

原创 精炼人工晶状体屈光力计算:使用跨层注意力和有效通道注意力的多模态框架

为人工晶状体 (IOL) 选择合适的度数对于白内障手术的成功至关重要。传统上,眼科医生依靠手动设计的公式(如“Barrett”和“Hoffer Q”)来计算 IOL 屈光力。然而,这些方法的准确性有限,因为它们主要关注眼轴长度和角膜曲率等生物识别数据,而忽略了揭示眼睛内部解剖结构的术前图像中的丰富细节。提出了一种新的深度学习模型,该模型利用多模态信息进行准确的 IOL 功率计算。

2025-02-26 10:35:29 857

原创 由疾病因果估计引导的视网膜图像中的多疾病检测

在分析视网膜图像以诊断眼病和其他全身性疾病方面取得了重大进展。然而,一个关键的挑战是多疾病检测,特别是在满足患者可能患有多种疾病的实际应用需求方面。为了应对这一挑战,本研究引入了一种新的端到端方法,使用由疾病因果估计指导的视网膜图像进行多疾病检测。利用疾病特异性特征,整合疾病因果关系以及图像特征与疾病状况之间的相互作用。(1) 疾病和图像特征之间的相互作用是通过 transformer 解码器中的交叉注意力来捕获的。

2025-02-26 10:19:48 319

原创 MM-Retinal:使用眼底图像文本专业知识进行知识增强的基础预训练

当前的眼底图像分析模型主要是为依赖于单个数据集的特定任务而构建的。学习过程通常基于数据驱动的范式,没有先验知识。提出了 MM-Retinal,这是一个多模态数据集,包含从专业眼底图书籍中收集的高质量图像-文本对。在 MM-Retinal 的支持下,提出了一种新的知识增强基础预训练模型,该模型结合了眼底图像-文本专业知识,称为 KeepFIT。采用图像相似性引导的文本修订和混合训练策略设计,以注入专业知识。提出的眼底基础模型在六个下游任务中实现了最先进的性能,并且在零样本和少样本场景中具有出色的泛化能力。

2025-02-25 09:53:30 424

原创 洞察:使用 LLM 进行眼表疾病诊断的多模式诊断管道

准确诊断眼表疾病在验光和眼科中至关重要,这取决于整合临床数据源(例如,睑板扫描成像和临床元数据)。传统的人工评估在量化临床观察方面缺乏精度,而当前基于机器的方法通常将诊断视为多类分类问题,将诊断限制为预定义的封闭式精选答案集,而没有推理每个变量与诊断的临床相关性。为了应对这些挑战,本研究采用大型语言模型 (LLM) 进行眼表疾病诊断,引入了创新的多模式诊断管道 (MDPipe)。首先使用视觉转换器通过将图像转换为可量化的形态学数据来解释图像,促进它们与临床元数据的集成,并能够将细微的医学见解传达给 LLM。

2025-02-25 09:25:37 1029

原创 基于眼底图像的泛化视觉损失估计用于高度近视

高度近视会显著增加不可逆性视力丧失的风险。传统的基于视野计的视野 (VF) 评估提供了视力丧失的系统量化,但它是主观且耗时的。因此,利用眼底照片估计 VF 的机器学习模型已成为有前途的替代方案。然而,由于 VF 数据的高可变性和有限可用性,现有的 VF 估计模型无法很好地泛化,尤其是在面对不同中心和人群的分布外数据时。为了应对这一挑战,提出了一种新的、参数高效的框架,以增强 VF 估计对分布内和分布外数据的广义鲁棒性。

2025-02-25 09:12:11 252

原创 CLIP-DR:文本知识引导的糖尿病视网膜病变分级与排名感知提示

糖尿病视网膜病变 (DR) 是糖尿病的一种并发症,通常需要几十年才能达到威胁视力的水平。准确、稳健地检测 DR 严重程度对于及时管理和治疗糖尿病至关重要。然而,目前的大多数 DR 分级方法对数据可变性(例如彩色眼底图像)的稳健性不足,对准确和稳健的分级构成了很大的困难。在这项工作中,提出了一种新的 DR 分级框架 CLIP-DR最近的预训练视觉语言模型,如 CLIP,展示了跨各种下游任务的显着泛化能力,可作为有效的基线模型。

2025-02-25 08:59:15 843

原创 一种具有多维语义增强的 OCT 图像高反射焦点分割网络

糖尿病性黄斑水肿 (DME) 是全球视力丧失的主要原因。光学相干断层扫描 (OCT) 因其非侵入性和高分辨率横截面视图而成为一种被广泛接受的诊断 DME 的成像工具。OCT 中高反射病灶 (HRF) 的临床评估有助于了解 DME 的起源并预测疾病进展或治疗效果。然而,HRF 中有限的信息和前景与背景之间的显著不平衡对其在 OCT 图像中的精确分割提出了挑战。提出了一种基于注意力机制的多维语义增强网络 (MUSE-Net) 用于 HRF 分割,以应对这些挑战。

2025-02-24 10:12:09 246

原创 用于手臂肌肉骨骼超声分割的面向混合结构的 Transformer

分割复杂的层结构,包括皮下脂肪、骨骼肌和手臂肌肉骨骼超声 (MSKUS) 中的骨骼,对于诊断和监测乳腺癌相关淋巴水肿 (BCRL) 的进展至关重要。然而,以前的研究主要集中在 MSKUS 中的单个肌肉或骨骼分割上,而忽略了表征这些结构的复杂和混合层形态。提出了一种称为混合面向结构的 Transformer (HSformer) 的新方法,它可以有效地捕获 MSKUS 中具有不同形态的分层结构。HSformer 结合了分层一致性相对位置编码和用于分层结构注意力的结构偏置约束。

2025-02-24 09:41:38 602

原创 用于细粒度进展学习的胸部 X 光图像中的症状解开

胸片检查是监测疾病严重程度的常用诊断性影像学检查。机器学习在基于单个医学图像的静态任务(例如分割或诊断)方面取得了重大进展。然而,基于纵向图像的疾病进展监测仍然相当不足,这为早期预后和及时干预提供了信息线索。在实践中,基础疾病的发展通常伴随着多种特异性症状的发生和变化。受此启发,提出了一个多阶段框架,从症状的角度对复杂的进展进行建模。引入了两个连续的模块,即症状解缠器 (SD) 和症状进展学习者 (SPL),以学习从静态诊断到动态疾病发展。

2025-02-21 10:05:05 729

原创 使用基于 Transformer 的检测模型进行局部胸部 X 线疾病和进展检测的表示学习

医学图像解读通常包含不同的任务,但流行的 AI 方法主要偏爱使用端到端图像到文本模型进行自动胸部 X 光读取和分析,而往往忽略了放射学报告的关键组成部分。同时,为相关但不同的任务采用单独的模型会导致计算开销,并且无法利用共享数据抽象的优势引入了一个胸部 X 射线解释框架,利用基于Transformer的对象检测模型,在大量数据上训练来学习局部表示。模型在识别语义上有意义的解剖区域方面实现了 ∼94% 的平均精度,促进了下游任务,即局部疾病检测和局部进展监测。

2025-02-21 09:19:04 277

原创 用于胸部 X 线异常检测的位置引导提示学习

胸部 X 线检查中的异常检测是一项关键任务。大多数方法主要对正态图像的分布进行建模,然后将与正态分布的显著偏差视为异常。最近,基于CLIP的方法在大量医学图像上进行了预训练,在零/少样本下游任务上显示出令人印象深刻的性能。探索基于 CLIP 的方法在胸部 X 射线异常检测中的潜力。提出了可学习的位置引导文本和图像提示,以使任务数据适应冻结的基于 CLIP 的预训练模型。为了增强模型的判别能力,我们在训练过程中提出了一种新的胸部 X 射线结构保持异常合成方法。

2025-02-20 09:51:30 286

原创 具有相对具体相似性的 COPD 分级的分层多实例学习

慢性阻塞性肺病 (COPD) 是一种以持续气流受限为特征的阻塞性肺病,是全球第三大死亡原因。作为一种异质性肺部疾病,COPD 表型的多样性及其病理学的复杂性对识别其分级构成了重大挑战。许多基于 3D CT 扫描的现有深度学习模型忽略了病灶区域的空间位置信息和不同病灶等级内的相关性。将 COPD 分级任务定义为多实例学习 (MIL) 任务,并提出了分层多实例学习 (H-MIL) 模型。

2025-02-20 09:27:29 409

原创 GEM:具有胸片视觉搜索行为匹配的上下文感知凝视监测

眼动估计在人类场景理解任务中至关重要,尤其是在医学诊断分析中。眼动追踪技术有助于记录医生在图像解释过程中的眼球运动,从而阐明他们的视觉注意力模式和信息处理策略。在本文中定义了医学放射学报告设置中的上下文感知凝视估计问题。为了了解放射科医生在医学图像解释过程中的注意力分配和认知行为,提出了一个上下文感知的 Gaze EstiMation (GEM) 网络,该网络利用从放射科医生那里收集的眼睛凝视数据来模拟他们在整个图像解释过程中的视觉搜索行为模式。由上下文感知模块、视觉行为图构造和视觉行为匹配组成。

2025-02-19 09:56:56 254

原创 用于缓解医学图像中捷径学习的凝视导向视觉 GNN

深度神经网络在医学图像分析中表现出卓越的性能。然而,由于捷径学习,它容易受到伪相关性的影响,这引发了人们对网络可解释性和可靠性的担忧。此外,在疾病指标通常微妙和稀疏的医学环境中,捷径学习会加剧。提出了一种新的凝视导向视觉 GNN(称为 GDViG),以利用放射科医生从凝视中获得的视觉模式作为专业知识,将网络引导到疾病相关区域,从而减少捷径学习。GD-ViG 由一个凝视映射生成器 (GMG) 和一个凝视定向分类器 (GDC) 组成。

2025-02-19 09:30:20 311

原创 Diff3Dformer:利用切片序列扩散通过 Transformer 网络增强 3D CT 分类

个体患者与肺部疾病相关的症状表现在不同程度上可能有所不同,这凸显了 CT 扫描中 3D 信息对医学图像分类的重要性。虽然 Vision Transformer 在图像分类任务中表现出优于卷积神经网络的性能,但它们的有效性通常在足够大的 2D 数据集上得到证明,并且它们很容易在小型医学图像数据集上遇到过拟合问题。

2025-02-18 09:44:06 1278

原创 COVID19肺炎:使用 CNN Transformer 位置感知特征编码网络进行多区域肺严重程度分类

本研究调查了利用 COVID-19 患者的胸部 X 光 (CXR) 数据对肺炎的严重程度进行分类,旨在提高 COVID-19 数据集的预测准确性,并在不同的肺炎病例中实现稳健的分类。开发了一种新颖的 CNN-Transformer 混合网络,利用位置感知功能和区域共享 MLP 来整合肺区域信息。这提高了对不同空间分辨率和评分的适应性,解决了由于临床测量不明确而导致的严重程度评估的主观性。该模型显示 COVID-19 和异质性肺炎数据集的肺炎严重程度分类都有显著改善。

2025-02-18 09:26:59 533

原创 CheXtriev:基于病例检索胸片的以解剖学为中心的表示

CheXtriev,这是一种基于图形的解剖学感知框架,用于胸片检索。与以前专注于全局特征的方法不同,该方法利用图形转换器从特定的解剖区域提取信息特征。捕捉了空间背景以及解剖位置和发现之间的相互作用。这种基于循证解剖学的背景化产生了更丰富的解剖学感知表示,并导致更准确、有效和高效的检索,特别是对于不太普遍的发现CheXtriv 在检索准确性方面比最先进的全球和本地方法高出 18% 到 26%,在排名质量方面比最先进的全球和本地方法高出 11% 到 23%。代码地址。

2025-02-18 09:09:42 315

原创 基于双学生-教师框架和CNN-ViT协同学习的产程超声图像耻骨联合与胎头分割

耻骨联合和胎头 (PSFH) 的分割是监测分娩进展和识别潜在分娩并发症的关键步骤。尽管深度学习取得了进步,但缺乏带注释的医学图像阻碍了分割的训练。传统的半监督学习方法主要利用基于卷积神经网络 (CNN) 的统一网络模型,并应用一致性正则化来减轻对大量注释数据的依赖。然而,这些方法在捕获未标记数据的判别特征和描绘超声图像中 PSFH 模糊边界所固有的长期依赖性方面往往不足。

2025-02-17 15:16:42 1007

原创 HUP-3D:用于辅助自我中心手持超声探头姿态估计的3D多视角合成数据集

以自我为中心的无标记 3D 关节姿态估计在混合现实医学教育中具有潜在的应用。理解手部和探针动作的能力为量身定制的指导和指导应用打开了大门提出了 HUP-3D,这是一个 3D 多视图多模态合成数据集,用于在产科超声背景下进行手部超声 (US) 探头姿势估计。数据集由超过 31k 组 RGB、深度和分割蒙版帧组成,包括与姿势相关的参考数据,重点是图像多样性和复杂性。采用基于摄像头视点的球体概念,我们可以捕捉各种视图,并使用预先训练的网络生成多个手抓姿势。

2025-02-17 14:48:19 561

原创 SkinCON:通过分布正则化自适应预测集 (DRAPS) 达成皮肤癌亚型不确定性的共识

深度学习已广泛应用于医学诊断。卷积神经网络和 transformer 可以实现很高的预测准确性,这与人类的表现相当,甚至超过人类的表现。然而,不确定性量化仍然是一个未解决的问题,阻碍了深度学习模型在实际环境中的部署。原则上,共形分析可以估计每个诊断预测的不确定性,但要有效地做到这一点,需要大量的人工注释来描述潜在的经验分布。这在过去一直具有挑战性,因为实例级类分布数据不可用:收集大量真值标签已经具有挑战性,而获取每个实例的类分布则更加困难。

2025-02-17 14:42:06 418

原创 BPaCo: 用于长尾医学图像分类的平衡参数对比学习

医学图像分类是一项必不可少的医学图像分析任务。然而,由于临床场景中罕见病的数据稀缺,获取的医学图像数据集可能呈现长尾分布。以前的作品采用阶级再平衡来解决这个问题,但表示通常不够区分。受到对比学习在表征学习中的力量的启发,在本文中,我们提出并验证了一种基于对比学习的框架,称为平衡参数对比学习 (BPaCo),用于处理长尾医学图像分类。BPaCo 中有三个关键组成部分:跨批次类平均,以平衡负类的梯度贡献;hybrid class-complement 让所有类出现在每个小批量中,用于判别原型;

2025-02-14 09:43:02 919

原创 通过稀疏 2D 心脏 MR 图像进行全心脏 3D+T的 表示学习

心脏磁共振 (CMR) 成像是评估心脏形态和功能的金标准。通常,会获取涵盖短轴 (SA) 和 2/3/4 腔长轴 (LA) 视图的多视图 CMR 堆栈,以进行全面的心脏评估。然而,有效地简化复杂的高维 3D+T CMR 数据并提炼出紧凑、连贯的表示仍然是一项挑战。目的:引入了一个全心脏自我监督学习框架,该框架利用MASK成像建模来自动揭示整个心脏堆栈中空间和时间斑块之间的相关性。这个过程有助于生成有意义且聚类良好的心脏表示,而无需依赖传统上需要且通常昂贵的标记数据。

2025-02-14 09:00:56 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除