计算机视觉中的图像识别技术详解
1. 计算机视觉中的目标识别挑战
在计算机科学研究中,构建能像人类一样运作的类人机器人是一个重要目标,甚至赋予其情感属性也并非不可能。例如,机器人可通过传感器感知周围环境温度,通过分析面部表情判断人的情绪。而当前极具挑战性的应用之一便是目标识别。
目标识别可基于多种数据类型,如音频、图像和文本。其中,图像识别因能提供丰富信息而成为计算机视觉中最受欢迎的应用。然而,世界上存在大量物体,区分它们是一项复杂任务。不同物体可能外观相近,仅在细微细节上有差异,且同一物体在不同环境下的外观也会不同,如受光照、视角、畸变和遮挡等因素影响。此外,直接使用像素进行图像识别并非良策,因为像素的微小变化会导致图像整体变化,使系统难以正确识别物体。因此,目标是找到一组独特的属性或特征,只要物体结构在图像中存在,这些特征就不会随像素位置或值的改变而变化。但手动从图像中提取特征是图像识别中的一大挑战,这促使自动特征提取方法成为替代方案。
为简化识别任务,可限制环境或目标物体。比如,不识别所有动物,而是针对特定群体;不考虑室内外所有场景,仅处理室内图像;不识别物体的所有视角,只处理部分视角。一般来说,创建窄人工智能应用虽有挑战,但比通用人工智能应用更容易且问题更少。
2. 水果图像识别应用构建思路
以构建水果图像分类识别应用为例,首先需了解一些通用的特征类型,然后从中找出最适合目标应用的特征。通过这个过程,能明白手动提取特征的困难以及为何卷积神经网络(CNNs)的自动特征挖掘更受青睐。
3. 图像识别流程
图像识别通常遵循一系列预定义步骤,从接受输入到返回期望结果。以下是一般的图像识别流程:
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



