论文主要要点记录《BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation》

摘要:

  1. 为了获取语义信息而丢失了底层细节信息,提出细节获取和语义信息分开获取。
  2. 较浅的网络层获取细节信息,较深的网络层获取语义信息
  3. 融合层融合特征表示
  4. 提出助推器训练策略booster training

介绍

1. 现在的语义分割主要采用两种策略:

  • 基于空洞卷积的,并且摈弃下采样操作:具有较大的计算量和内存占用
  • 基于编码器解码器结构,采用自顶向下和横向连接,恢复高分辨率特征图,这些跳连接对于内存的访问成本较高

2. 语义分支可以通过快速的下采样策略以及较少的通道变得轻量级,基于深度卷积,增强接收域捕获丰富的上下文信息

3. 使用带有一系列辅助预测头的增强训练策略增强推理性能,在推理阶段不会被使用

相关背景

  1. 传统的分割方法基于阈值选择(Otsu,1979)、区域增长(Vincent and Soille,1991)、超像素(Ren and Malik,2003;Achanta et al.,2012;Van den Bergh et al.,2012)和图(Boykov and Jolly,2001;Rother et al.,2004)算法,采用手工制作的特征来解决这一问题。最近,基于FCN的新一代算法(Long et al.,2015;Shelhamer等人,2017)在不同的基准上不断提高最先进的性能。各种方法都是基于两种类型的骨干网:(1)扩张骨干网;(2) encoder-decoder骨干网络。
### 关于 BiSeNetV2 模型的详细介绍 BiSeNetV2 是一种高效的语义分割模型,特别适用于实时场景的应用。它通过优化网络结构设计,在保持高精度的同时显著降低了计算复杂度和内存消耗[^1]。 #### 1. **BiSeNetV2 的核心特点** BiSeNetV2 主要改进了原始版本中的细节分支(Detail Branch)和语义分支(Semantic Branch),并引入了一个新的聚合模块(Gather Module)。这种设计使得模型能够在低分辨率输入下提取全局上下文信息,同时保留高分辨率特征以捕捉局部细节[^2]。 #### 2. **代码实现与配置** 在实际应用中,可以通过调整 `bisenetv2_coco.py` 配置文件中的参数来适配不同数据集的需求。例如,最大迭代次数可通过如下方式设置: ```python max_iter=600, # 可根据具体任务需求调整为更大的数值,如 180000 ``` 训练命令支持多种 GPU 设备分配方案,以下是两种常见的启动方式: - 方法一:手动设置可见设备并通过环境变量控制显卡数量。 ```bash export CUDA_VISIBLE_DEVICES=0 NGPUS=1 cfg_file=configs/bisenetv2_coco.py torchrun --nproc_per_node=$NGPUS tools/train_amp.py --config $cfg_file ``` - 方法二:直接运行脚本,默认使用一块显卡。 ```bash torchrun --nproc_per_node=1 tools/train_amp.py --config configs/bisenetv2_coco.py ``` 以上命令均基于 PyTorch 提供的分布式训练工具 `torchrun` 进行扩展[^4]。 #### 3. **ONNX 和 RKNN 转换** 完成训练后,可将模型导出为 ONNX 格式以便后续部署至嵌入式平台或其他框架。对于特定硬件(如 Rockchip RK3568),需进一步利用 rknn-toolkit2 将 ONNX 模型转换为目标芯片兼容的 RKNN 格式。 在转换过程中需要注意的关键参数包括: - 使用 `--mean_value` 和 `--scale_values` 来预处理图像归一化操作,从而减少推理阶段的工作量[^3]。 #### 4. **教程推荐** 针对初学者而言,《从零开始使用 BiSeNet(语义分割)网络训练自己的数据集》是一篇非常实用的文章,涵盖了从准备数据到最终部署的所有环节。此外,官方仓库还提供了详细的源码解读以及 CityScapes 数据集上的默认配置示例。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值