2、计算机视觉中的图像识别技术详解

计算机视觉中的图像识别技术详解

1. 计算机视觉中的目标识别挑战

在计算机科学研究中,构建能像人类一样运作的类人机器人是一个重要目标,甚至赋予其情感属性也并非不可能。例如,机器人可通过传感器感知周围环境温度,通过分析面部表情判断人的情绪。而当前极具挑战性的应用之一便是目标识别。

目标识别可基于多种数据类型,如音频、图像和文本。其中,图像识别因能提供丰富信息而成为计算机视觉中最受欢迎的应用。然而,世界上存在大量物体,区分它们是一项复杂任务。不同物体可能外观相近,仅在细微细节上有差异,且同一物体在不同环境下的外观也会不同,如受光照、视角、畸变和遮挡等因素影响。此外,直接使用像素进行图像识别并非良策,因为像素的微小变化会导致图像整体变化,使系统难以正确识别物体。因此,目标是找到一组独特的属性或特征,只要物体结构在图像中存在,这些特征就不会随像素位置或值的改变而变化。但手动从图像中提取特征是图像识别中的一大挑战,这促使自动特征提取方法成为替代方案。

为简化识别任务,可限制环境或目标物体。比如,不识别所有动物,而是针对特定群体;不考虑室内外所有场景,仅处理室内图像;不识别物体的所有视角,只处理部分视角。一般来说,创建窄人工智能应用虽有挑战,但比通用人工智能应用更容易且问题更少。

2. 水果图像识别应用构建思路

以构建水果图像分类识别应用为例,首先需了解一些通用的特征类型,然后从中找出最适合目标应用的特征。通过这个过程,能明白手动提取特征的困难以及为何卷积神经网络(CNNs)的自动特征挖掘更受青睐。

3. 图像识别流程

图像识别通常遵循一系列预定义步骤,从接受输入到返回期望结果。以下是一般的图像识别流程:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值