自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 GCN:图卷积神经网络

传统的图像处理方法,如卷积神经网络(CNN)和视觉Transformer,通常假设图像是一个规则的网格或序列结构。然而,现实中的物体往往是不规则的,具有复杂的拓扑关系,例如人可以由头、躯干和四肢构成,彼此之间形成类似图的连接关系。它为GNN在计算机视觉领域的应用开辟了新的方向,使得GNN的研究成果可以迁移到视觉任务中,进一步丰富了计算机视觉的理论体系。ViG Block 就是为了解决这个问题,它通过将图像表示为图结构,并在这个图上进行信息的聚合与更新,提供了比网格或序列更灵活、表达力更强的方式。

2025-06-26 09:50:15 1072

原创 基于多尺度群Agent注意力的图卷积解码网络二维医学图像分割

提取多尺度特征。PVT-V2(b) 基于多尺度组代理注意力(MSGAA)的图卷积解码器:逐步恢复空间分辨率并融合全局-局部特征。主要包括三个部分:全局-局部交互图卷积网络(GLIGCN)模块、基于注意力的上采样卷积融合(AUCF)模块和用于分割预测结果的卷积1×1。

2025-06-11 21:35:02 1110

原创 SliceMamba with Neural Architecture Search for Medical Image Segmentation

论文中 Fig. 2 展示了 SliceMamba 的整体网络架构,其设计遵循经典的 UNet 结构,包括编码器(Encoder)、解码器(Decoder)以及跳跃连接(Skip Connection)机制。以 VM-UNet 为基线,逐步添加组件测试:+BSS表示在基线顶部添加BSS模块,将每个S3块的特征切片方法固定为[4,4]。例如,m和n可以取{2, 4},形成特征切片间隔集S = {(2, 2), (2, 4), (4, 2), (4, 4)}。

2025-05-28 21:07:33 1005

原创 Frequency-Enhanced Lightweight Vision Mamba Network for Medical Image Segmentation

FFE 模块通过将特征图转换到频率域,能够捕获图像的全局特征,这对于增强模型对图像整体结构的理解非常有用,尤其是在处理具有复杂背景和模糊边界的医疗图像时,FFE 模块可以帮助模型更准确地识别和分割目标区域。通过多方向的特征扫描,SS2D能够促进全局感受野的建立,同时保留相关的信息,使得模型能够捕捉长距离依赖关系。输入频率特征增强(FFE)模块,通过快速傅里叶变换(FFT)将特征转换到频域,利用学习滤波器(LF)增强全局特征,再通过逆傅里叶变换(IFFT)还原到空间域。

2025-04-22 20:54:11 1844

原创 复现“EMCAD:Efficient Multi-scale Convolutional Attention......”过程中出现的问题

参考链接:点击链接查看和 Kimi 的对话 https://kimi.moonshot.cn/share/cvv5e6rduqbdceke09ag。数据集:直接使用的来自。,使用单进程运行程序。

2025-04-15 20:56:10 411 2

原创 BEFNet: A Hybrid CNN-Mamba Architecture for Accurate Skin Lesion Image Segmentation

​的差异性特征,同时利用反向注意力补充低层细节信息,最终通过多分支融合增强特征的全局表达能力和局部细节保留能力。该模块在皮肤病变分割任务中尤为重要,能够有效应对病变形状不规则、边界对比度低等挑战,最终提升模型的Dice系数(DSC)和敏感度(SE)。:直接利用BOA提供的边界特征作为Key和Value的输入,显式强化边界区域的响应。:结合低层细节(如边缘、纹理)与高层语义(如病变区域整体形状),增强边界的完整性。:通过αα和ββ掩码动态分配权重,抑制无关背景,强化边界区域的响应。

2025-04-09 21:09:02 635

原创 3.13组会:Precision and efficiency in skincancer segmentation through adual encoder deep learning mod

ViT编码器各层的特征(如 Z3,Z6等)通过跳跃连接直接传递到CNN解码器的对应层,确保全局上下文信息与局部空间细节的融合。:ViT编码器在不同深度(如第3、6、9、12层)输出多分辨率的特征序列(如 Z3,Z6,Z9,Z12),用于后续解码。:解码器每层的输入不仅包含上一层的上采样结果,还融合来自ViT编码器的对应层特征,增强细节恢复能力。:ViT编码器的全局特征与MobileNetV2提取的局部特征(通过另一编码器分支)进行。:一个 1x1 的点卷积,用于最终特征图的生成。

2025-03-12 22:05:11 1445

原创 TransUNet复现过程中出现的问题

解决方法:首先在cmd里输入nvcc --version查看cuda的版本,为11.5解决方法:减少bs我把bs设置为了12解决方案:DataLoader的参数num_workers设置为0。

2025-03-10 18:29:17 1301 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除