基于标签转移的非参数场景解析
在计算机视觉领域,场景解析是一项重要的任务,它旨在识别图像中每个像素所属的对象类别。本文将介绍一种基于标签转移的非参数场景解析系统,该系统通过将现有标注图像的标签转移到输入图像来实现场景解析。
1. 相关工作
在过去的十年里,对象识别领域取得了显著的进展。早期的研究主要集中在单类建模,如人脸、数字、字符和行人识别,这些问题在某些情况下已基本得到解决。近年来,研究重点转向了多类对象识别。
在创建对象检测系统时,特征描述和提取是第一步。常见的特征描述符包括基于梯度的特征(如SIFT和HOG)、形状上下文和补丁统计等。这些特征描述符可以以稀疏或密集的方式应用于图像。
稀疏关键点表示通常用于图像对之间的匹配,由于匹配两组关键点的通用问题是NP难的,因此已经开发了近似算法来高效计算关键点匹配并最小化错误率。而密集表示则通过对图像邻域或整个图像的视觉特征分布进行建模来处理。
对象识别方法可以分为参数化方法和非参数化方法。参数化方法包括学习生成/判别模型,如模板匹配方法,但这些方法通常假设对象是刚性的,对变形的处理能力有限。为了处理铰接对象,星座模型被设计用于将对象建模为部件的集合,并考虑空间信息、深度排序信息和多分辨率模式。近年来,还出现了通过众包将人类纳入视觉识别循环的新方法。
非参数化方法则依赖于图像检索和匹配,如Video Google系统允许用户在视频中指定对象的视觉查询并检索同一对象的实例。另一个非参数化系统通过将未知查询图像与密集标注的图像数据库进行匹配,使用最近邻构建标签概率图来修剪不太可能出现在图像中的对象检测器。非参数化方法也广泛应用于网络数据中以检索相似图像。
此
基于标签转移的场景解析
超级会员免费看
订阅专栏 解锁全文
2487

被折叠的 条评论
为什么被折叠?



