计算机视觉中的数学工具与基础概念
1. 计算机视觉与机器学习概述
人类具备想象、创造和构建新事物的能力,这种创新能力推动了科学、技术、工程和艺术等多个领域的进步。例如,我们建造摩天大楼、制造手机、发射火箭等,这些成就都基于物理和数学定律。然而,专家的经验往往会随着他们的离世而消失。如今,借助机器学习算法,我们可以让计算机学习并继承人类的经验。
计算机视觉旨在让计算机具备类似人类的感知能力,它与机器学习密切相关。机器学习是人工智能的一个分支,能让计算机从数据中“学习”,而无需明确编程。机器学习主要包括监督学习、无监督学习、半监督学习和强化学习等类型,每种类型都有独特的算法和方法。
2. 概率、熵与Kullback - Leibler散度
2.1 概率与香农熵
图像由像素组成,像素的排列模式决定了图像的分辨率,从像素的分布概率可以生成新图像。因此,理解统计学中的概率概念对于计算机视觉研究至关重要。
-
离散随机变量 :以抛硬币为例,对于公平硬币,“正面”和“反面”出现的概率均为50%,这是一个离散随机变量,其概率质量函数(PMD)为 (P(X) = {1/2, 1/2})。若硬币不公平,正面出现概率 (p = 0.45),抛10次硬币出现4次正面的概率可通过二项分布函数计算:
[P(X = x) = \frac{n!}{x!(n - x)!}p^x (1 - p)^{n - x}]
将 (n = 10),(x = 4),(p = 0.45) 代入可得概率约为23.8%。 -
连续随机变量
超级会员免费看
订阅专栏 解锁全文
2097

被折叠的 条评论
为什么被折叠?



