性能测量与概率基础
1. 性能测量的重要性
在构建用于预测、分类以及在数据中寻找模式的系统时,我们需要一种方法来评估这些系统的工作效果。为此,我们使用了各种数值测量方法,统称为性能指标。这些指标能够帮助我们精确描述系统的正确行为,更重要的是,当系统给出错误答案时,能具体指出错误的类型。它们是解读任何系统结果的关键。
性能指标基于概率,即我们看到不同类型结果的可能性。因此,我们将先简要讨论概率,重点关注最重要的概念,然后将其应用于构建性能指标。
2. 概率基础
2.1 不同类型的概率
概率有多种类型,我们通过一个比喻来讨论其中几种。
2.1.1 飞镖投掷比喻
飞镖投掷是讨论基本概率的经典比喻。想象我们站在一个房间里,手中拿着一堆飞镖,面对一堵墙。墙上没有挂软木靶,而是涂有不同颜色和大小的色块。我们向墙投掷飞镖,并记录每支飞镖落在哪个颜色区域(背景也视为一个区域)。
我们假设飞镖总是会击中墙的某个位置,所以每支飞镖击中墙的概率是100%。我们可以用浮点数(实数)和百分比来表示概率,例如,概率为1.0相当于100%,概率为0.75相当于75%,依此类推。
为了便于讨论,我们假设飞镖击中墙上任何一点的概率是相同的,即墙上每一点被飞镖击中的机会均等,这种概率分布称为均匀分布。
下面通过一个例子来说明。墙上有一个红色正方形,它覆盖了墙总面积的一半。由于墙上每一点被击中的可能性相等,当我们投掷飞镖时,飞镖落在红色正方形内的概率是50%,即0.5。这个概率就是红色正方形面积与墙总面积的比值。正方形越大,其包含的面积越大,飞镖落在其中的可能性就越高
超级会员免费看
订阅专栏 解锁全文
4549

被折叠的 条评论
为什么被折叠?



