概率与分类器性能评估:原理与应用
在概率和机器学习的领域中,理解各种概率概念以及如何评估分类器的性能是至关重要的。下面我们将深入探讨联合概率、边缘概率、分类器的正确性衡量以及混淆矩阵等关键内容。
联合概率
在概率计算中,联合概率是一个重要的概念。用符号表示,$P(B,A) = P(A,B)$,因为两者都表示同时落在 $A$ 和 $B$ 中的概率。与条件概率不同,在联合概率中,$A$ 和 $B$ 的命名顺序并不重要。
为了更好地理解联合概率,我们可以通过一个具体的场景来举例。假设存在一家冰淇淋店,顾客可以选择不同口味的冰淇淋,并且可以选择华夫筒或者杯子来盛放。我们定义:如果有人点了香草味冰淇淋,那么事件 $V$ 为真;如果有人选择用华夫筒来装冰淇淋,那么事件 $W$ 为真。
- $P(V)$ 表示随机一位顾客点香草味冰淇淋的概率。
- $P(W)$ 表示随机一位顾客选择华夫筒的概率。
- $P(V|W)$ 表示选择了华夫筒的顾客点香草味冰淇淋的概率。
- $P(W|V)$ 表示点了香草味冰淇淋的顾客选择华夫筒的概率。
- $P(V,W)$ 表示随机一位顾客点了用华夫筒装的香草味冰淇淋的概率。
边缘概率
简单概率的另一个术语是边缘概率。理解这个术语的来源有助于我们理解如何计算多个事件的简单概率。“边缘”这个词在概率的上下文中可能看起来很奇怪,但它的由来与包含预先计算好的概率表的书籍有关。在这些表中,我们(或印刷商)会将每一行的总数相加,并将这些总数写在页面的边缘。
我们继续以冰淇淋店为例来解释边缘概
超级会员免费看
订阅专栏 解锁全文
2191

被折叠的 条评论
为什么被折叠?



