4、图像分类基础与学习类型解析

图像分类基础与学习类型解析

1. 什么是图像分类

图像分类的核心任务是从预定义的类别集合中为图像分配一个标签。具体来说,就是分析输入图像并返回一个能对该图像进行分类的标签,且这个标签总是来自预定义的可能类别集合。

例如,假设可能的类别集合为: categories = {cat, dog, panda} 。当向分类系统输入一张图像时,目标是从这个类别集合中为该图像分配一个标签,比如“dog”。分类系统也可以通过概率为图像分配多个标签,如“dog: 95%; cat: 4%; panda: 1%”。

更正式地讲,对于一个具有W×H像素、分别为红、绿、蓝三个通道的输入图像,目标是处理这个W×H×3 = N像素的图像,并找出正确分类图像内容的方法。

1.1 术语说明

在进行机器学习和深度学习时,我们有一个试图从中提取知识的数据集。数据集中的每个示例或项目(无论是图像数据、文本数据、音频数据等)都是一个数据点。因此,数据集是数据点的集合。

在图像分类的上下文中,数据集是图像的集合,每个图像就是一个数据点。

1.2 语义鸿沟

人类和计算机对图像的理解存在差异,这就是语义鸿沟。例如,我们能轻松区分一张猫的照片和一张狗的照片,但计算机看到的只是两个大的像素矩阵。

以一张宁静海滩的照片为例,我们可以从空间布局(天空在图像顶部,沙子/海洋在底部)、颜色(天空是深蓝色,海水比天空颜色浅,沙子是棕褐色)和纹理(天空图案相对均匀,沙子很粗糙)等方面描述图像。但如何将这些信息编码成计算机能理解的形式呢?答案是应用特征提取来量化图像内容。特征提取是对输

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值