计算机视觉中的机器学习:从传统方法到现代模型
1. 计算机视觉概述
计算机视觉旨在模仿人类的视觉能力,它主要包含两个方面:图像形成(模拟人类的感官系统)和机器感知(模拟人类的认知系统)。模拟人类感官系统侧重于硬件以及传感器(如相机)的设计与布局;而模拟人类认知系统则采用机器学习方法从图像中提取信息。
当我们看到一张雏菊的照片时,人类的认知系统能够识别出它是雏菊。本书所构建的图像分类机器学习模型,正是从雏菊的照片出发,模仿人类的这种识别能力。
2. 机器学习在计算机视觉中的发展
在2010年代初期,从照片中提取信息的计算机视觉方法并不涉及机器学习,而是集中在去噪、边缘检测、纹理检测和形态学(基于形状)操作等方面。随着人工智能(尤其是机器学习)的发展,这种情况发生了改变。
人工智能探索计算机模仿人类能力的方法,机器学习是人工智能的一个子领域,它通过向计算机展示大量数据并让其从中学习来实现这一目标。专家系统是人工智能的另一个子领域,它通过编程让计算机遵循人类逻辑来模仿人类能力。
在2010年代之前,像图像分类这样的计算机视觉任务通常通过构建定制的图像过滤器来实现专家制定的逻辑。如今,图像分类主要通过卷积网络这种深度学习形式来完成。
下面通过一个例子对比机器学习方法和专家系统方法:
- 机器学习方法 :以识别雏菊为例,向计算机展示大量带有标签(正确答案)的雏菊、郁金香等花卉图像,计算机基于这些标记的训练数据集学习如何对未见过的图像进行分类。
- 专家系统方法 :首先采访人类植物学家,了解他们对花卉分类的方法。例
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



