论文解读《SOLO: Segmenting Objects by Locations》

实例分割属于比较challenging的任务,他相当于是object detection和semantic segmentation的结合体。在SOLO出现之前,有两种常用的paradigm:(1)top-down:先进行目标检测,再对检测框做分割,经典的方法有Mask RCNN、PANet、TensorMask等;(2)bottom-up:让每一个像素学习到一个embedding,拉近相同instance像素之间的embedding的距离,推远不同instance像素之间embedding的距离,最后根据embedding之间的距离进行cluster。

而这两种范式都显得indirect,前者需要较高的检测精度,后者需要有较好的embedding的学习,这都稍都影响了实例分割的效果。因此本文提出的SOLO可谓打破陈规之举,因为他实现了之间端到端预测instance mask的功能。也就是说,输入是一张image,直接输出instance mask以及对应的类别,整个过程属于box-free和grouping-free的范式。

作者在研究SOLO时对instance之间的差别进行了rethinking。通过对所有的annotation统计发现:98.3%的instance质心相隔超过30个pixel,而剩下的1.7%中,大小比例超过1.5的占据了40.5%。也就是说,instance的不同完全可以归结于两个因素:(1)Location;(2)Size。

(1)对于Location的考虑:把image分成 S∗SS*SSS 个cell,每一个cell负责预测1个instance。当一个实例落入某个cell,则该cell负责预测该instance;(2)对于Size的考虑:采用FPN结构来适用于不同尺度的instance。

下图是整个SOLO网络结构示意图:
在这里插入图片描述
输入为一张image,通过FCN进行多尺度的特征提取,得到多尺度的feature map。随后接入两个分支:(1)分类分支:最后的输出是 S∗S∗CS*S*CSSC 维度的矩阵,这里 C 表示总类别数,表示着总共 S∗SS*SS<

### MESA 技术概述 MESA (Modular, Efficient, Scalable Architecture) 是一种旨在处理大规模数据集并提供高效查询响应的技术架构。该技术核心在于能够灵活地对各种类型的数据进行分割和重组,从而实现高效的存储、检索以及分析功能[^1]。 ### 工作原理:通过分割匹配一切 为了适应不同类型的应用场景需求,MESA采用了独特的分片策略来进行数据管理。具体来说: - **动态分片机制**:可以根据实际业务逻辑自动调整如何切分原始输入流中的对象或记录;这种灵活性使得即使面对高度异构的数据源也能够有效应对[^2]。 - **多维度索引构建**:针对每一个被划分出来的片段建立丰富的元数据描述,并据此创建多个视角下的快速访问路径。这不仅限于简单的键值映射关系,还包括基于语义理解的内容分类标签体系等复杂结构[^3]。 ```python def create_segment(data_stream): segments = [] while data_stream.has_next(): item = data_stream.next() # 动态决定当前项应归属于哪个片段 target_segment_id = determine_target(item) try: segment = next((s for s in segments if s.id == target_segment_id)) except StopIteration: # 如果不存在,则新建一个对应的片段容器 segment = Segment(target_segment_id) segments.append(segment) # 将项目加入到指定位置的同时更新关联索引信息 segment.add_item_with_index_update(item) ``` 上述代码展示了简化版的片段化过程,在此过程中会持续监控传入的数据流,并依据预定义规则将其分配至合适的片段内保存起来。与此同时还会维护一套或多套辅助性的查找表以便后续操作时能迅速定位所需部分[^4]。
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值