《HTC：Hybrid Task Cascade for Instance Segmentation》论文笔记

本文链接：https://blog.youkuaiyun.com/m_buddy/article/details/103534955

本文介绍了HTC（Hybrid Task Cascade）网络，它在级联优化策略中结合检测和分割任务，通过多阶段处理提高实例分割性能。与Cascade Mask RCNN相比，HTC在COCO数据集上提升了1.5%，达到38.4%的mask AP。文章详细阐述了级联分割分支、空间上下文信息的利用以及损失函数设计，展示了各组件对性能的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码地址：mmdetection

1. 概述

导读：级联优化策略在许多的任务中被证实是提升性能的有效策略，而在实例分割中引入级联优化策略还是比较新的尝试。而简单地将Cascade RCNN与Mask RCNN相结合（Cascade Mask RCNN）只能带来很少的性能提升，其中的关键是没有很好利用检测与分割之间相互关联，因而这篇文章基于此提出了一个新的网络结构Hybrid Task Cascade（HTC），文章的方法从如下的两个方面进行改进：1）在级联优化中将分割与检测任务组合在一起去完成多阶段地处理；2）采用了一个全卷积的分支（分割分支）提供空间信息，从而帮助区分分割任务中的前景与背景。从而网络可以学习到更具区分性的特征并且在每个stage上组合互补的特征。使用单纯的HTC网络在COCO数据集上相比Cascade Mask RCNN提升了1.5%到达38.4%（Cascade Mask RCNN中级联带来的收益更多是体现在边界框更为准确上），在测试集上获得了48.6的mask AP。

这篇文章的算法借鉴了级联优化的策略，其关键是通过每个stage上多任务与级联组合增强信息的流动，并利用空间信息来进一步提升分割精度。则这篇文章提供的级联优化策略与之前的优化策略的对比见下图2所示：
在这里插入图片描述