计算机视觉中的图像识别技术详解
1. 计算机视觉中的识别概述
计算机科学研究热衷于构建能像人类一样运行的类人机器人,甚至赋予它们情感属性也并非遥不可及。借助传感器,机器人可感知周围环境的温度;通过面部表情,能判断人的情绪状态。在当前,目标识别是极具挑战性的应用领域。识别可基于音频、图像和文本等不同类型的数据,而图像识别因能提供丰富信息,成为计算机视觉中最受欢迎的应用。
世界上存在大量物体,区分它们是一项复杂任务。不同物体可能外观相似,仅存在细微差别;同一物体在不同环境下的呈现也各不相同,如光照、视角、畸变和遮挡等因素都会影响其在图像中的表现。直接使用像素进行图像识别并非良策,因为像素的微小变化可能导致图像整体的显著改变,使系统难以准确识别物体。因此,我们的目标是找到一组独特的属性或特征,这些特征不受像素位置和值变化的影响,只要物体结构在图像中有所体现即可。手动提取图像特征在图像识别中颇具挑战,这也使得自动特征提取方法逐渐成为主流。
鉴于当前在任何环境中识别任何物体都很复杂,一种可行的方法是限制环境或目标物体。例如,我们可以只针对特定的动物群体进行识别,而非识别所有动物;或者将环境限制在室内图像,而非同时处理室内和室外图像;也可以仅处理物体的某些特定视角,而非所有视角。通常,创建窄领域的人工智能应用虽然具有挑战性,但相较于通用人工智能应用,它更易于实现且问题更少。
2. 图像识别流程
与大多数传统识别应用类似,图像识别通常遵循一系列预定义步骤,从接收输入到输出期望结果。以下是这些步骤的简要概括:
graph LR
A[输入图像] --> B[
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



