uperformer

 

在resnet101和swin作为backbone上做了实验,改进的是decoder的结构。Decoder会接受四个stage输出的feature作为输入,最后融合的feature接MLP(两层全连接,有激活,先扩张为原来通道数的4倍,再卷回原来的通道数)卷成语义数量最后用逐像素的交叉熵损失,并且使用了第三阶段的feature用FCN网络接了auxilary loss。激活在backbone和decoder中用的都是GELU,归一化用的是layer Norm。

backbone四个阶段输出的feature为:

 

 那decoder的结构可以表示为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值