计算机视觉:概念与应用解析
1. 引言
人工智能(AI)是机器学习(ML)、深度学习、计算机视觉等子领域的源头。它将智能定义为知识获取与表示,即获取知识并将其应用于解决问题。AI 问题的目标是提高成功率而非准确率,而 ML 问题则侧重于利用模型提高准确率,不关注成功率。一般来说,人工智能是设计智能机器和程序的能力,机器学习是在无需明确编程的情况下学习的能力。AI 涉及决策,旨在让机器模拟自然智能;机器学习则从数据中学习,以最大化机器在特定任务中的性能。
深度学习作为机器学习的一个子集,使得多层神经网络的计算成为可能,能够处理大量数据。早期单层神经元算法在训练阶段权重固定,对准确率影响不佳。后来设计的算法可调整权重以减少误差,专注于为目标检测、图像分割、语音识别、特征提取等特定任务提供高精度结果。这些与图像相关的应用与 AI 的另一个领域——计算机视觉密切相关。
计算机视觉旨在让计算机观察和感知周围环境,是几乎所有涉及视觉内容计算的源头,尤其是数字图像。机器将图像视为一系列具有特定颜色和值的像素,有助于模拟人类大脑读取图像的方式,最终目的是从像素中提取信息。该领域最初仅基于统计方法,现在已转向深度神经网络,兼顾目标达成和准确率。
图像与计算机视觉常被混淆,但它们有所不同。两者都需处理图像,但使用方式各异。图像处理通过平滑、锐化、增加对比度等功能处理图像,输出仍是图像;计算机视觉则旨在识别图像、解释信息,输出图像大小、颜色强度等信息,还尝试对图像进行分类、识别实例等,涉及深度学习技术。图像处理使用概率方法,如隐马尔可夫模型、编辑、恢复技术和滤波等,并借助神经网络实现更多学习和智能建模。
计算机视觉的应用广泛且不断增加,对零售、医疗、金融服务等几
计算机视觉核心概念与应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



