在一幅图像中,某些区域比图像其他部分更加突出,更能够吸引观看者的注意力。图像的这种特性可以用视觉显著性这一指标衡量。图像中某个区域的视觉显著性高,就代表这个区域更能吸引观察者注意。视觉显著性这一概念最早由Tsotsos等在视觉注意力的研究中被提出,视觉显著性又称为视觉注意力、不可预测度、稀有度等。视觉显著性的估计方法大致可以分为两种类型,一种是基于人的心理视觉特性进行建模,通过图像区域对比度、颜色、灰度等底层图像特征对图像的视觉显著性进行估计;另一种是基于机器学习的方法,通过大量人工标记了显著性区域的样本训练出视觉显著性估计模型。这两种方法在原理上差距较大,一般作为两个领域来研究。本文中采用前一种模型计算芯棒图像的视觉显著度。
人类能很容易地判断一个图像区域的重要程度,并快速地将注意力聚焦在重要的区域,但从计算的角度而言,快速且准确地完成这项任务并不容易。图像视觉显著性被广泛地用于各种各样的计算机视觉应用,如图像分割、目标识别、图像压缩和图像检索等。研究者对于不同的应用场景提出了各种各样的视觉显著性检测算法。针对视觉显著性检测的研究主要有两个关注点,一是快速的、自底向上的显著性分割,另一个是相对来说比较慢的,取决于任务目标的自顶向下的方法。显著性区域
图像视觉显著性检测
最新推荐文章于 2021-07-13 10:29:06 发布
本文介绍图像视觉显著性检测的概念及其应用。视觉显著性是指图像中吸引注意力的特性,可用于图像分割、目标识别等多个领域。文章探讨了两种主要的检测方法:基于心理视觉特性的建模和基于机器学习的方法。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
Langchain-Chatchat
AI应用
Langchain
Langchain-Chatchat 是一个基于 ChatGLM 等大语言模型和 Langchain 应用框架实现的开源项目,旨在构建一个可以离线部署的本地知识库问答系统。它通过检索增强生成 (RAG) 的方法,让用户能够以自然语言与本地文件、数据库或搜索引擎进行交互,并支持多种大模型和向量数据库的集成,以及提供 WebUI 和 API 服务
4568

被折叠的 条评论
为什么被折叠?



