21、基于标签转移的非参数场景解析

基于标签转移的场景解析

基于标签转移的非参数场景解析

在计算机视觉领域,场景解析是一项重要的任务,它旨在识别图像中每个像素所属的对象类别。本文将介绍一种基于标签转移的非参数场景解析系统,该系统通过将现有标注图像的标签转移到输入图像来实现场景解析。

1. 相关工作

在过去的十年里,对象识别领域取得了显著的进展。早期的研究主要集中在单类建模,如人脸、数字、字符和行人识别,这些问题在某些情况下已基本得到解决。近年来,研究重点转向了多类对象识别。

在创建对象检测系统时,特征描述和提取是第一步。常见的特征描述符包括基于梯度的特征(如SIFT和HOG)、形状上下文和补丁统计等。这些特征描述符可以以稀疏或密集的方式应用于图像。

稀疏关键点表示通常用于图像对之间的匹配,由于匹配两组关键点的通用问题是NP难的,因此已经开发了近似算法来高效计算关键点匹配并最小化错误率。而密集表示则通过对图像邻域或整个图像的视觉特征分布进行建模来处理。

对象识别方法可以分为参数化方法和非参数化方法。参数化方法包括学习生成/判别模型,如模板匹配方法,但这些方法通常假设对象是刚性的,对变形的处理能力有限。为了处理铰接对象,星座模型被设计用于将对象建模为部件的集合,并考虑空间信息、深度排序信息和多分辨率模式。近年来,还出现了通过众包将人类纳入视觉识别循环的新方法。

非参数化方法则依赖于图像检索和匹配,如Video Google系统允许用户在视频中指定对象的视觉查询并检索同一对象的实例。另一个非参数化系统通过将未知查询图像与密集标注的图像数据库进行匹配,使用最近邻构建标签概率图来修剪不太可能出现在图像中的对象检测器。非参数化方法也广泛应用于网络数据中以检索相似图像。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值