计算机视觉中的概率基础:从随机变量到边缘概率
计算机视觉旨在从图像中提取有用信息,但这是一项极具挑战性的任务。尽管在过去几十年中,众多聪明才智之士投身其中,但距离构建通用的“视觉机器”仍有很长的路要走。不过,近年来计算机视觉取得了显著进展,这得益于计算机处理能力的提升以及机器学习的广泛应用。下面我们将深入探讨概率在计算机视觉中的应用,这是理解计算机视觉模型的重要基础。
1. 随机变量
随机变量是一个表示不确定数量的概念。它可以是一个实验的结果,比如抛硬币;也可以是对一个实际波动属性的测量,例如测量温度。当我们观察多个随机变量的实例时,它可能每次都会取不同的值,而且某些值出现的频率可能更高。这种信息由随机变量的概率分布 Pr(x) 来表示。
随机变量可分为离散型和连续型:
- 离散型随机变量 :从预定义的集合中取值。这个集合可以是有序的,如掷骰子的结果 1 - 6;也可以是无序的,如观察天气时的“晴天”“雨天”“雪天”。它可以是有限的,像从标准牌组中随机抽一张牌有 52 种可能结果;也可以是无限的,例如理论上下一班火车上的人数是无界的。离散型随机变量的概率分布可以用直方图或 Hinton 图来可视化,每个结果都有一个正概率,且所有结果的概率之和始终为 1。
- 连续型随机变量 :取值为实数。这些值可以是有限的,如完成一场 2 小时考试所需的时间被限制在 0 到 2 小时之间;也可以是无限的,例如下一班公交车到达所需的时间是无界的。无限连续变量可以定义在整个实数范围内,也可以有上下界,如车辆的一维速度可以取任何值,但速度下限为 0。连续型随机变量的概率分布可以通过绘制概率密度函数 (pdf
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



