自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6063)
  • 资源 (2)
  • 收藏
  • 关注

原创 【荐读IEEE TPAMI】基于模型的强化学习与独立想象力

在基于视觉的交互系统中,世界模型学习行动的后果。然而,在实际场景中,如自动驾驶,存在不可控制的动态,这些动态独立于或与行动信号稀疏相关,这使得学习有效的世界模型变得具有挑战性。为了解决这个问题,我们提出了Iso-Dream++,这是一种基于模型的强化学习方法,具有两个主要贡献。首先,我们优化了逆动力学,鼓励世界模型从环境混合的时空变化中隔离出可控制的状态转换。其次,我们基于解耦的潜在想象进行策略优化,我们将不可控制的状态滚动到未来,并将其与当前可控制的状态自适应地关联起来。

2024-05-18 19:15:00 1244

原创 【荐读IEEE TPAMI】无监督去雨:非对称对比学习与自相似性相遇

大多数现有的基于学习的去雨方法都是在合成的雨-清洁对上进行有监督训练的。合成雨与真实雨之间的领域差距使它们在复杂的真实雨场景中的泛化能力降低。此外,现有方法主要独立利用图像或雨层的属性,很少有方法考虑它们之间的相互排斥关系。为了解决这一困境,我们探索了每层内部的内在自相似性以及两层之间的相互排斥性,并提出了一种无监督的非局部对比学习(NLCL)去雨方法。非局部自相似性图像块作为正样本被紧密地拉在一起,而雨块作为负样本则被显著地推开,反之亦然。

2024-05-13 12:24:06 1058

原创 TMI‘24 | 基于先验知识嵌入U-Net的颈动脉三维超声图像血管壁体积全自动测量

基于三维(3D)颈动脉(CA)超声(US)图像测量的血管壁体积(VWV)有助于评估颈动脉粥样硬化并管理卒中风险患者。手动测量工作具有主观性,且需要经过良好培训的操作员,而全自动测量工具尚不可用。因此,我们提出了一种全自动VWV测量框架(Auto-VWV),使用颈动脉先验知识嵌入的U-Net(CAP-UNet)从3D CA US图像中无需手动干预地测量VWV。Auto-VWV框架旨在提高重复VWV测量的一致性,这是首个用于VWV测量的全自动框架。

2025-06-14 09:30:00 8

原创 TMI 2025 | GenSelfDiff-HIS:利用扩散进行生成式自监督的组织病理学图像分割

组织病理学图像分割是一项既费力又耗时的任务,通常需要经验丰富的病理学家进行分析,才能准确检查。为了减轻这一负担,人们采用了有监督的机器学习方法,使用大规模的标注数据集来进行组织病理学图像分析。然而,在很多情况下,训练这类模型时,大规模标注数据的可获取性是一个瓶颈。自监督学习(SSL)是另一种模式,它仅利用通常大量存在的无标注数据来构建模型,从而提供了一些缓解办法。自监督学习的基本思想是训练一个网络,在无标注数据上执行一个或多个伪任务或前置任务,随后将其作为各种下游任务的基础。

2025-06-14 09:30:00 12

转载 CVPR 2025 | 超轻量级特征匹配新突破:轻量级特征匹配Mamba网络解析

联合扫描比顺序扫描性能更优,聚合器对全局感受野和全方位性至关重要,JEGO策略优于EVMamba和VMamba的策略,且JamMa比基于注意力的方法更高效。然而,现有的先进特征匹配器在性能与效率之间的平衡上仍面临挑战。总的来说,JamMa作为一种基于Mamba的超轻量级特征匹配器,通过探索新的扫描 - 合并策略,在性能和效率之间实现了显著的平衡,为特征匹配领域带来了新的思路和方法。生成四个方向上长度为。通过高频相互作用,以及在平衡感受野上使用局部聚合器,在最小化计算开销的同时,生成了具有惊人鲁棒性的特征。

2025-06-13 19:03:59 13

原创 MICCAI 2023 | 基于膝关节图表示的跨视图对齐分割网络(CAS-Net)

磁共振成像(MRI)已成为临床膝关节检查的重要工具。在临床实践中,膝关节扫描通常采用多视图堆叠的二维切片进行采集,这样既能保证诊断的准确性,又能节省扫描时间。然而,从多视图二维扫描中获取精细的三维膝关节分割结果是一项具有挑战性的任务,但这对于形态学分析来说却是必不可少的。此外,放射科医生在医学研究中需要对多个二维扫描中的膝关节进行分割标注,这增加了额外的工作量。在本文中,作者提出了跨视图对齐分割网络(CAS - Net),用于从多视图二维MRI扫描和仅有的矢状面视图标注中生成三维膝关节分割结果。

2025-06-13 09:30:00 13

原创 TMI 2025 | 基于稀疏图像切片的左心室3D表面重建方法Slice2Mesh

电影磁共振成像(cine MRI)是一种广泛用于评估左心室功能和运动的技术,因为它能够捕捉时间信息。然而,由于空间分辨率有限,cine MRI仅在规则的位置和方向上提供少量稀疏扫描,这给重建密集的三维心脏结构带来了挑战,而这对于以动态三维方式更好地理解心脏结构和运动至关重要。在本研究中,作者提出了一种基于学习的新型三维心脏表面重建方法Slice2Mesh,该方法在稀疏轮廓点的部分监督下,直接从cine MRI图像的稀疏切片中预测准确且高保真的三维网格。

2025-06-13 09:30:00 20

转载 回首才发现,2024 年,博士学历断崖式贬值元年

2,2019年博士开始扩招,到了2020年由于环境不景气,接着扩招,找不到工作的人也就开始跟风读博,结果到了2020年比上一年扩招了3万人。7,目前一线城市的好学校,名校毕业,手里有顶刊,年龄不超过35岁,有大佬撑腰,这些因素缺一不可。至于帝都的学校,普通人看看就好,即使能留下,也谈不上有什么生活质量。6,各个学校都在喊缺人,其实缺的是有帽子的大佬,普通青椒,乃至副教授,有的是,月薪的6k的讲师,一群博士都要抢着去。5,目前提供的实名编的学校极少,南方的城市,即便是地方院校,也开始模仿非升即走。

2025-06-12 19:20:44 24

转载 【arXiv 2025】新型激活函数B-SiLU,即插即用,无缝集成各种模型,涨点!

对于正输入,ReLU定义为恒等函数x。包含人工智能全领域(机器学习、深度学习等),适用于图像分类、目标检测、实例分割、语义分割、单目标跟踪(SOT)、多目标跟踪(MOT)、输入为负时,输出为0,这意味着该神经元的梯度也为0,导致该神经元在训练过程中无法被激活,从而无法对任何数据产生响应。RGBT、图像去噪、去雨、去雾、去模糊、超分等计算机视觉(CV)和图像处理任务,以及其他各类人工智能相关任务。

2025-06-12 19:20:44 59

转载 【CVPR 2025亮点】MobileMamba:轻量级多感受野视觉 Mamba 网络,突破视觉处理效率与性能瓶颈

例如,增量实验表明,相较于基线模型,MobileMamba 在 Top - 1 准确率上提高了 0.9%,Top - 5 准确率上提高了 0.6%,同时吞吐量提高了 729 张图像/秒。状态空间模型因能以线性计算复杂度捕捉长距离依赖关系受到关注,但当前基于 Mamba 的轻量级模型仅报告了 FLOPs,不一定与快速推理速度相关,存在推理速度慢和性能差的问题。:在推理过程中,将批归一化与前面的卷积层或线性层融合,通过重新计算新卷积层的权重和偏差,减少层数,提高计算效率,加快前向传递速度。上提高了 1.3%;

2025-06-12 19:20:44 15

原创 医图论文 Arxiv‘25 | MRANet: 一种改进的残差注意力网络用于肺和结肠癌分类

肺和结肠癌是癌症死亡率的主要贡献者。早期和准确的诊断对于有效治疗至关重要。通过在不同图像检测中利用成像技术,学习模型在从组织病理学图像中自动分类癌症方面显示出潜力。这包括组织病理学诊断,这是癌症类型识别的重要因素。本研究专注于创建一个高效深度学习模型,用于从组织病理学图像中识别肺和结肠癌。作者提出了一种基于改进的残差注意力网络架构的新方法。该模型在包含多个类别的25,000张高分辨率组织病理学图像数据集上进行了训练。

2025-06-12 09:30:00 214

原创 TCSVT 2025 | 基于潜在特征引导和扩散先验的极端图像压缩方法研究

在极低比特率(每像素低于0.1比特,即bpp)下进行图像压缩是一项重大挑战,因为会出现大量信息丢失的情况。在这项工作中,作者提出了一种新颖的两阶段极端图像压缩框架,该框架利用预训练扩散模型强大的生成能力,在极低比特率下实现逼真的图像重建。在第一阶段,作者将图像在扩散空间中的潜在表示作为指导,采用基于变分自编码器(VAE)的压缩方法对图像进行压缩,并将压缩后的信息初步解码为内容变量。第二阶段利用预训练的稳定扩散模型,在内容变量的指导下重建图像。

2025-06-12 09:30:00 615

原创 MICCAI 2023 | 医学深度网络理解的类别独立视觉解释

视觉解释有潜力提升我们对深度学习模型及其决策过程的理解,这对于构建透明、可靠且值得信赖的人工智能系统至关重要。然而,现有的可视化方法存在局限性,包括它们依赖类别标签来识别感兴趣区域,而在模型部署期间可能无法获取这些标签,如果提供了错误的标签,还可能导致错误的诊断。为解决这一问题,作者提出了一种名为Hessian - CIAM的新型类别无关视觉解释方法。该算法使用Hessian矩阵(即激活函数的二阶导数)对最后一个卷积层的激活权重进行加权,并在推理时生成感兴趣区域热图。

2025-06-12 09:30:00 16

原创 TMM 2024 | 基于共享耦合桥接策略的弱监督局部特征学习

局部特征学习在视觉定位、图像匹配和三维重建等经典视觉任务中具有重要意义。受训练样本的限制,弱监督策略已成为局部特征学习中广泛关注的有效方案之一。目前,它仍存在一些需要进一步改进的弱点,主要包括提取的局部描述子的判别能力、检测到的关键点的定位精度以及弱监督局部特征学习的效率。本文专注于通过相机位姿监督提升稀疏局部特征学习的性能,针对性地提出了一种共享耦合桥接方案,该方案为弱监督局部特征(SCFeat)学习带来了四项轻量且有效的改进。主要包括:i)用于局部描述子学习的特征融合 ResUNet 骨干网络(F2R

2025-06-12 09:30:00 13

原创 Arxiv‘25 | RDD4D: 基于4D注意力引导的道路损伤检测与分类

道路损伤检测和评估是基础设施维护的关键组成部分。然而,现有方法在检测单张图像中的多种道路损伤类型时,尤其是在不同尺度下的检测,往往表现不佳。这是由于缺乏包含多种损伤类型且具有不同尺度的道路数据集。为了克服这一不足,作者首先提出了一个名为“多样化道路损伤数据集”(DRDD)的新数据集,该数据集捕捉了单张图像中的多种道路损伤类型,填补了现有数据集的空白。接着,作者提出了RDD4D模型,该模型利用Attention4D模块,能够在多个尺度上更好地细化特征。

2025-06-11 21:18:41 83

原创 TIP 2024 | 高相似度通过注意力机制用于单图像超分辨率

近年来,非局部注意力(NLA)领域的发展重新激发了基于自相似性的单图像超分辨率(SISR)的研究兴趣。研究人员通常使用NLA来探索SISR中的非局部自相似性(NSS),并取得了令人满意的重建结果。然而,一个令人惊讶的现象是,标准NLA的重建性能与随机选择区域的NLA相似,这促使作者重新审视NLA。本文首先从不同角度分析了标准NLA的注意力图,发现其生成的概率分布总是对每个局部特征具有完全支持,这意味着在SISR中,尤其是需要建模长距离依赖时,为不相关的非局部特征分配值是一种统计上的浪费。

2025-06-11 21:16:15 130

原创 TIP 2024 | 用于单图像去雨的多尺度融合与分解网络

卷积神经网络(CNN)和自注意力机制(SA)在低层视觉任务中表现出色,如图像超分辨率、去雨和去雾。CNN擅长获取具有平移等变性的局部连接,而SA则更擅长捕捉长距离依赖关系。然而,CNN和Transformer各自存在局限性,如CNN的有限感受野和弱多样性表示,以及SA的低效率和弱局部关系学习。为此,作者提出了一种多尺度融合与分解网络(MFDNet),用于去除雨扰动,该网络结合了这两种架构的优点,同时保持了高效性和有效性。

2025-06-11 21:14:16 15

原创 TMI 2024 | CT通用分割模型的先验类别网络

在计算机断层扫描(CT)图像中对解剖结构进行准确分割对于临床诊断、治疗规划和疾病监测至关重要。当前的深度学习分割方法受到数据规模和模型大小等因素的阻碍。受医生识别组织方式的启发,我们提出了一种新的方法,即先验类别网络(PCNet),通过利用不同解剖结构类别之间的先验知识来提升分割性能。我们的PCNet包含三个关键组件:先验类别提示(PCP)、层次类别系统(HCS)和层次类别损失(HCL)。PCP利用对比语言-图像预训练(CLIP)以及注意力模块,系统地定义了临床医生识别的解剖类别之间的关系。

2025-06-11 19:19:05 78

原创 MICCAI 2023 | 基于成像先验的双视图光片荧光显微镜全局上下文感知图像融合

光片荧光显微镜(LSFM)是一种平面照明技术,能够对样本进行高分辨率成像。然而,当光子穿过厚组织时,光散射会导致图像出现“散焦”问题,影响图像质量。为了解决这个问题,双视图成像技术应运而生。该技术通过从相反方向观察样本,理想情况下可以对样本的各个部分进行扫描。目前的图像融合方法通过局部比较两个视图的图像质量来确定聚焦像素,但由于其视野有限,会导致空间上不一致的聚焦度量。

2025-06-11 19:15:13 15

转载 【CVPR 2025亮点】MambaVision:当Mamba遇上Transformer,视觉骨干网络迎来新范式

MambaVision的出现,不仅是对“效率-精度”矛盾的一次优雅解答,更标志着视觉模型进入“混合智能”的新纪元——或许,真正的突破从来不是非此即彼的选择,而是博采众长的智慧。,首次将Mamba的高效建模能力与Transformer的全局感知优势深度融合,在ImageNet分类、MS COCO检测分割等任务中刷新SOTA,为视觉骨干网络的发展开辟了新路径。:MambaVision-B的Top-1准确率达84.2%,超越ConvNeXt-B(83.8%)、Swin-B(83.5%)等经典模型。

2025-06-11 08:11:46 24

转载 独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

与拼音文字不同,汉字的字形与语义之间存在直观的形态关联(如「日」象形太阳,「山」酷似山峰剪影,「火」宛若跳动火焰,「网」象征交错纵横的网络),这些字形本身就承载着浓厚的语义信息和文化密码。当AI能够理解「氵」多与水有关,「亻」多与人有关,「讠」多与说话有关,「钅」多与金属相关,「火」多与火焰有关时,它对中文语料的利用就可以更加高效,对整个中文知识体系的理解也更为深刻。FOT与SRA模块除了共享CGE提供的字形编码外,还共享生成信号的特征,从而分别向生成信号施加约束,确保生成信号的真实性、可靠性、多样性。

2025-06-10 16:27:36 21

转载 算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

值得注意的是,它在所有指标上都优于层数匹配的Transformer,并且在一半指标上优于参数量匹配的Transformer。值得注意的是,尽管对数线性Mamba-2(带MLP)包含了Transformer中没有的额外层(如深度卷积),但在序列长度达到32K时,其吞吐量依然超过了Transformer。另外,在长卷积模型(long convolution models)中,可以通过使用快速傅里叶变换(FFT)进一步将复杂度降为O(TlogT),相较于原始的O(T²)计算量,实现了显著的效率提升。

2025-06-08 20:20:48 25

原创 TIP 2024 | MM-Net:基于MixFormer的多尺度网络用于解剖和功能图像融合

解剖和功能图像融合是多种医学和生物应用中的重要技术。近年来,基于深度学习(DL)的方法已成为多模态图像融合领域的主流方向。然而,现有的基于DL的融合方法难以同时有效捕捉局部特征和全局上下文信息。此外,特征的多尺度多样性在图像融合中是一个关键问题,但在大多数现有工作中往往缺乏足够的关注。本文针对上述问题,提出了一种基于MixFormer的多尺度网络,称为MM-Net,用于解剖和功能图像融合。在该方法中,引入了一种改进的基于MixFormer的骨干网络,以充分从源图像中提取多尺度的局部特征和全局上下文信息。

2025-06-08 09:00:00 22

原创 TCSVT 2025 | 用于零样本指代表达图像分割的双向掩码选择

零样本指代表达图像分割(RIS)旨在通过自然语言表达分割出目标掩码,且无需任何训练。尽管现有研究取得了一定进展,但零样本学习中缺乏训练过程导致信息不足,使得零样本分割性能不佳。作者提出了双向掩码选择(BMS)框架,这是首次将负掩码应用于零样本RIS的工作。作者的思路是利用负掩码中目标语义周围的语义上下文信息,来增强对跨模态细粒度相关性的理解。此外,作者提出了一种新颖的掩码自适应融合策略,无需额外训练即可结合正掩码和负掩码的互补信息。

2025-06-08 09:00:00 29

原创 MICCAI 2023 | 基于条件伯努利扩散模型的医学图像分割

医学图像分割是一项具有挑战性的任务,由于肿瘤边界不清晰、存在多种合理标注等因素,导致其具有内在的模糊性和高度的不确定性。在临床实践中,分割掩码的准确性和多样性对于为放射科医生提供有价值的参考都至关重要。尽管现有的扩散模型在各种视觉生成任务中表现出强大的能力,但处理分割中的离散掩码仍然具有挑战性。为了获得准确且多样的医学图像分割掩码,作者提出了一种用于医学图像分割的新型条件伯努利扩散模型(BerDiff)。

2025-06-08 09:00:00 25

原创 TIP 2025 | IFENet:用于可见光-深度-热成像三模态显著目标检测的交互、融合与增强网络

可见光-深度-热成像(VDT)显著目标检测(SOD)旨在通过利用三模态信息来突出最具视觉吸引力的目标。然而,现有模型未能充分探索多模态之间的相关性和差异性,导致检测性能不尽如人意。本文提出了一种交互、融合与增强网络(IFENet)来执行VDT SOD任务,该网络包含三个关键步骤:多模态交互、多模态融合和空间增强。具体而言,基于Transformer骨干网络,IFENet能够获取多尺度多模态特征。首先,作者部署了基于图的多模态间和模态内交互(IIGI)模块,以探索模态间的通道相关性和模态内的长程空间依赖性。

2025-06-07 23:04:03 24 1

原创 TIP 2024 | 无监督光谱去马赛克与轻量级光谱注意力网络

本文提出了一种基于深度学习的无监督光谱去马赛克技术。现有的许多基于深度学习的技术依赖于合成图像的监督学习,通常在真实图像上表现不佳,尤其是随着光谱波段数量的增加。本文提出了一种基于光谱马赛克图像特性的综合无监督光谱去马赛克(USD)框架,涵盖了训练方法、模型结构、变换策略以及模型选择策略。为了使网络能够动态建模光谱相关性,同时保持紧凑的参数空间,作者降低了光谱注意力模块的复杂性和参数数量。这是通过将光谱注意力张量分解为空间维度上的光谱注意力矩阵和通道维度上的光谱注意力向量来实现的。本文还提出了。

2025-06-07 23:03:19 25

原创 医图论文 MIA 2025 | 超越强标签:基于高斯伪标签的非增强 CT 中类椭圆血管结构分割的弱监督学习

基于深度学习的术前计算机断层血管造影(CTA)图像中血管结构自动分割有助于计算机辅助诊断和干预。虽然CTA是常用的标准方法,但非造影CT成像具有避免与造影剂相关并发症的优势。然而,由于血管边界的模糊性,劳动密集型的标注工作和较高的标注变异性阻碍了传统基于强标签的全监督学习在非造影CT中的应用。本文引入了一种新颖的弱监督框架,利用CT切片中血管结构的椭圆拓扑特性。该框架包括基于作者提出的标准的高效标注流程、生成二维高斯热图作为伪标签的方法,以及通过体素重建损失和分布损失与伪标签相结合的训练过程。

2025-06-07 23:00:44 25

原创 MICCAI 2023 | 边界加权对数一致性提高分割网络的校准

神经网络的预测概率和准确率之间通常仅存在微弱的相关性。图像分割训练数据中固有的标签模糊性加剧了这种校准不当的问题。作者表明,随机变换下的对数一致性可作为一种空间变化的正则化手段,避免在标签模糊的像素处做出过度自信的预测。作者对该正则化方法进行边界加权扩展,在前列腺和心脏核磁共振成像(MRI)分割任务中实现了目前最优的校准效果。

2025-06-07 22:59:20 17

原创 医图论文 MIA 2025 | TopoTxR:用于动态对比增强磁共振成像中乳腺实质学习的拓扑引导深度卷积网络

由于潜在组织结构的复杂性,在动态对比增强磁共振成像(DCE - MRI)中对乳腺实质进行特征描述是一项具有挑战性的任务。现有的定量方法,如影像组学和深度学习模型,缺乏对包括纤维腺体组织在内的复杂细微实质结构的明确量化。为解决这一问题,作者提出了一种新颖的拓扑方法,该方法明确提取多尺度拓扑结构,以更好地近似乳腺实质结构,然后通过注意力机制将这些结构融入基于深度学习的预测模型。作者提出的拓扑感知深度学习模型TopoTxR利用拓扑学原理,为对疾病病理生理学和治疗反应至关重要的组织提供更深入的见解。

2025-06-07 22:58:35 18

转载 膜拜,新一届ACM博士论文奖正式公布

其次,他研究了人机协作如何使自我指导的心理健康干预更容易获得、更容易参与,从而增强寻求支持的人的能力。通过一种基于强化学习的方法,并通过对来自最大同伴支持平台的 300 名同伴支持者进行的随机试验进行评估,他证明了基于 AI 的反馈可以帮助支持者在对话中更有效地表达共情。作者在论文中描述了他开发的两个支持心理健康和福祉的人机协作系统,以及此类系统的评估框架。在众多应用中,尤其是密码学领域,我们更需要一种稳健的计算限制,即存在某种特定任务,使得任何受限于低复杂度的算法都无法成功执行,甚至无法做出可靠近似。

2025-06-07 20:43:28 21

原创 医图论文 Arxiv‘25 | MSV-Mamba: 用于超声心动图分割的多尺度视觉Mamba网络

超声心动图图像分割在分析心脏功能和诊断心血管疾病中起着至关重要的作用。超声成像经常面临诸如高噪声水平、低时空分辨率以及解剖结构复杂性等挑战。这些因素显著阻碍了模型准确捕捉和分析心脏各区域的结构关系和动态模式的能力。Mamba作为一种新兴模型,是目前最前沿的方法之一,广泛应用于各种视觉和语言任务。它能够以线性复杂度高效捕捉全局信息,并弥补了卷积神经网络(CNN)和传统Transformer的不足。

2025-06-07 09:30:00 22

原创 MIA 2025 | 基于2D超声心动图视频的3D心脏形状重建及其临床应用

经胸超声心动图(TTE)是一种无需电离辐射即可快速、无创地评估心脏形态和功能的重要工具。然而,该检查存在用户内部和用户之间的差异,并且记录通常仅限于二维成像以及对舒张末期和收缩末期容积的评估。作者开发了一种全新的、完全自动化的基于机器学习的框架,以生成具有高时间分辨率的个性化左心室(LV)血池的4D(三维加时间)模型。通过特定的二维超声心动图视图,利用在合成数据集上预训练的深度神经网络,并使用一种针对断层成像数据的新型优化方法以自监督的方式进行微调,从而重建出4D形状。模型训练无需三维的真实数据。

2025-06-07 09:30:00 21

转载 Science披露:近3年,垃圾论文激增,92%来自中国

西北大学的Reese Richardson表示,其他研究人员在一些课题中也发现了类似现象,"这种免费数据源让几乎任何人都可以采用已知的研究方法,然后换上新的变量,以一种‘疯狂研究’的姿态创造出新的‘发现’。”他补充道,研究人员为了自身职业发展,往往选择发表更多的论文而不是更高质量的论文。Spick团队的报告指出,近年来基于NHANES数据库的低质论文泛滥,可能是“论文工厂”的运作、人工智能生成文本的滥用以及大型公共数据库的成熟共同促成的。Scientific Reports副主编。

2025-06-06 19:13:50 178

原创 医图论文 ACM MM‘24 | CBNet:基于协作的弱监督息肉检测

本文中,作者提出了一种基于协作的新型网络(CBNet),这是一个由图像标签监督的两阶段息肉检测框架。该框架通过与分割协作进行分类来去除错误的建议,并通过聚合自适应多层次区域特征获得更准确的检测器。具体而言,作者设计了基于协作的区域提议网络(CBRPN),通过删除不含息肉的提议来减少噪声的负面影响,使网络能够捕获息肉特征。此外,为了增强息肉的位置完整性和分类精度,作者在骨干分类层的指导下聚合多层次感兴趣区域(ROI)特征,即自适应ROI融合模块(ARFM)。

2025-06-06 09:30:00 16

原创 医图论文 MIA 2025 | 基于可变形注意力和邻域特征聚合的多对比度图像超分辨率(DANCE):在解剖和代谢MRI中的应用

多对比度磁共振成像(MRI)从不同角度反映人体组织信息,在临床应用广泛。通过利用易获取模态参考图像(Refs)中的辅助信息,多对比度MRI超分辨率(SR)方法可从难获取模态的低分辨率(LR)图像合成高分辨率(HR)图像。在本研究中,作者系统探讨了LR和Ref之间跨模态不对齐可能产生的影响,并在此基础上提出了一种基于深度学习的新方法,即具有可变形注意力和基于邻域特征聚合的计算高效(DANCE)方法,该方法对不对齐情况不敏感。

2025-06-06 09:30:00 17

转载 Mamba作者新工作:取代DeepSeek在用的注意力机制,专为推理打造!

它关注的是在不同层之间如何融合注意力信息,能减少每一层的冗余计算。尤其在语言建模方面,无论是预训练还是下游评估,Mamba-3B模型都优于同等规模的Transformer模型,并能与两倍于其规模的Transformer模型相媲美。,它通过分组共享KV缓存减少内存占用,在视觉Transformer(ViT)等任务中表现良好,适用于大规模数据处理,目前已应用于Llama 3等开源模型。相比之下,中间传统的多头注意力机制(MHA)每个查询头都有独立的键和值,由于没有共享,导致它需要更多的内存来存储所有的键和值。

2025-06-05 14:48:57 33

转载 【TCSVT 2025】即插即用,边缘高斯聚合模块EGA,目标检测新SOTA!

例如,在DOTA-v1.0数据集上,LEGNet-S在小车辆(SV)和游泳池(SP)检测类别中分别达到了81.42%和82.00%的AP,显著超过了其他方法。它包含一个新颖的边缘高斯聚合(EGA)模块,该模块结合了基于Scharr算子的边缘先验和不确定性的高斯建模,以增强网络对噪声和目标形状及方向变化的鲁棒性。LEGNet-T作为轻量级变体,实现了78.96%的mAP,仅使用3.6M参数,比之前最有效的竞争对手(DecoupleNet-D2)少41.9%的参数,同时提供了0.92%更高的mAP。

2025-06-05 14:48:57 34

原创 医图论文 Arxiv‘25 | GraphITE:基于图的可解释组织检查用于增强乳腺癌病理学的可解释性

在医学病理学中,可解释的人工智能(XAI)对于增强深度学习模型在癌症诊断中的可解释性和临床可信度至关重要。然而,这些模型的“黑箱”性质往往限制了其在临床中的应用。作者提出了GRAPHITE(基于图的可解释组织检查),一种用于乳腺癌组织微阵列(TMA)分析的后处理可解释框架。GRAPHITE采用多尺度方法,提取不同放大倍率的图像块,构建层次图,并利用图注意力网络(GAT)和尺度注意力网络(SAN)来捕捉尺度依赖的特征。作者在140个肿瘤TMA核心和4个良性全切片图像上训练了模型,并从中创建了140个良性样本,

2025-06-05 09:30:00 27

原创 ACM MM‘24 | 基于 CT 扫描的多域解耦多视图 X 射线图像合成

X射线图像凭借其高分辨率和快速成像速度,在术中过程中发挥着至关重要的作用,极大地推动了后续的分割、配准和重建工作。然而,过量的X射线在一定程度上给人体健康带来了潜在风险。从体积扫描数据生成X射线图像的数据驱动算法,受到X射线与体积数据配对稀缺的限制。现有的方法主要是通过对整个X射线成像过程进行建模来实现。在本研究中,作者提出了一种基于学习的方法,称为CT2X - GAN,它利用来自三个不同图像域的内容和风格解耦,以端到端的方式合成X射线图像。

2025-06-05 09:30:00 16

Python视觉实战项目31讲.pdf

本手册中主要涉及以下几部分,首先是对 OpenCV中自带的基本函数进行介绍。其次是OpenCV的实战项目,一方面是基于实际项目利用OpenCV实现特定对象的检测,例如车道线检测、路面的坑洼检测、等;另一方面是基于OpenCV实现图像增强,例如利用OpenCV消除运动所引起的图像模糊等。最后是OpenCV与深度学习等其他相结合实现图像分割、人脸检测、运动检测等难度较大的问题。

2020-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除