AS - TransUnet与基于惯性分解的空中机械臂轨迹规划技术解析
1. AS - TransUnet模型介绍
在图像语义分割领域,AS - TransUnet模型展现出了卓越的性能。该模型通过一系列独特的设计,有效提升了分割的准确性和鲁棒性。
1.1 特征提取与编码
AS - TransUnet在编码器部分采用了膨胀率分别为6、12和18的膨胀卷积,以此获取不同感受野的特征图,进而得到多尺度特征信息。将这些多尺度信息融合后得到的深度特征图,会嵌入位置信息,并转换为可输入到Transformer进行编码的补丁块。具体步骤如下:
1. 利用膨胀卷积获取不同感受野的特征图。
2. 融合多尺度特征信息得到深度特征图。
3. 嵌入位置信息到深度特征图。
4. 将特征图转换为补丁块输入到Transformer。
1.2 解码器设计
解码器部分使用了TransUNet提出的级联上采样模块(CUP)来解码隐藏特征,并输出最终的分割掩码。首先将编码器输出的隐藏特征序列进行重塑,然后使用CUP模块将特征图从低分辨率转换为全分辨率的H × W。CUP通过跳跃连接与编码器形成U形架构,通过不同分辨率级别实现特征聚合,从而得到准确的分割结果。其流程如下:
1. 重塑隐藏特征序列。
2. 使用CUP模块进行上采样。
3. 通过跳跃连接实现特征聚合。
4. 输出最终分割掩码。
1.3 注意力块
在卷积神经网络中,不同通道通常代表不同的特征。为了给每个通道的特征图分配权重,AS - TransUnet选择添加CBAM(Convoluti
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



