- 博客(2)
- 收藏
- 关注
原创 TransUNet代码解读
随后,DecoderCup利用CUP结构逐级提升特征分辨率,并在此过程中结合从编码器阶段获取的高分辨率特征,通过跳过连接传递到相应的解码层,以实现精细的空间定位能力。DecoderCup类是Vision Transformer (ViT) 模型中的解码器组件,它的作用是将编码器的输出转换回图像的空间维度,以便进行像素级的分割任务。可能代表模型中跳过(skip)连接的数量,这是一种在卷积神经网络(如UNet、ResNet等)中常见的结构,用于将较浅层的特征直接传递给深层或解码阶段以保留更多细节信息。
2024-04-21 14:27:55
3423
1
原创 TransUNet复现实验bug解决:汽车部件分割任务
model\vit_checkpoint\imagenet21k\R50+ViT-B_16.npz改成绝对路径,源码的训练权重包名可能不太一样,我们这里也要修改成R50+ViT-B_16。5.最终方法,直接注释掉#net.load_from(weights=np.load(config_vit.pretrained_path))#,不使用作者提供的预训练权重,自己训练也能跑,效果可能会比较差。先设置了max_epoch=1,batch_size=2,运行train.py,可以运行(能跑就行,哈哈哈)
2024-04-07 15:22:43
958
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人