自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 TransUNet代码解读

随后,DecoderCup利用CUP结构逐级提升特征分辨率,并在此过程中结合从编码器阶段获取的高分辨率特征,通过跳过连接传递到相应的解码层,以实现精细的空间定位能力。DecoderCup类是Vision Transformer (ViT) 模型中的解码器组件,它的作用是将编码器的输出转换回图像的空间维度,以便进行像素级的分割任务。可能代表模型中跳过(skip)连接的数量,这是一种在卷积神经网络(如UNet、ResNet等)中常见的结构,用于将较浅层的特征直接传递给深层或解码阶段以保留更多细节信息。

2024-04-21 14:27:55 3423 1

原创 TransUNet复现实验bug解决:汽车部件分割任务

model\vit_checkpoint\imagenet21k\R50+ViT-B_16.npz改成绝对路径,源码的训练权重包名可能不太一样,我们这里也要修改成R50+ViT-B_16。5.最终方法,直接注释掉#net.load_from(weights=np.load(config_vit.pretrained_path))#,不使用作者提供的预训练权重,自己训练也能跑,效果可能会比较差。先设置了max_epoch=1,batch_size=2,运行train.py,可以运行(能跑就行,哈哈哈)

2024-04-07 15:22:43 958 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除