机器学习中的概率应用与贝叶斯定理
1. 概率的基本概念与作用
概率用于衡量事件发生的可能性,以数值形式表示,范围在 0(事件不可能发生)到 1(事件必然发生)之间。例如抛硬币,虽然无法确定结果是正面还是反面,但能知道两种结果的概率。若多次尝试,中间值如 0.25、0.5 和 0.75 表示事件发生的频率。将概率乘以尝试次数,可估算事件平均发生的次数。比如事件发生概率 p = 0.25,尝试 100 次,该事件大约会发生 0.25 * 100 = 25 次。
以扑克牌为例,从一副 52 张的法式扑克牌中随机抽取一张特定花色的概率为 0.25,因为牌被平均分为四种花色。若要确定抽到 A 的概率,由于有四种不同花色的 A,所以概率 p = 4/52 = 0.077。
概率可通过观察经验性地定义,即统计特定事件发生次数与所有关注事件的总数之比。例如计算银行交易中欺诈发生的概率,或特定国家中人们患某种疾病的概率,可使用记录数据(如数据库记录或直接观察),将欺诈或患病次数除以总交易数或特定地区人口数,结果在 0 到 1 之间,可作为特定情况下某事件的基线概率。
然而,统计所有事件的发生次数并非总是可行,这时就需要抽样。抽样基于一定的概率预期,通过观察大事件集或对象集的一小部分,能推断事件的正确概率,以及与对象集相关的定量测量或定性类别。例如,要跟踪美国过去一个月的汽车销售情况,无需跟踪全国每一笔销售,选取全国部分汽车销售商的销售数据作为样本,就能确定定量指标(如汽车平均售价)或定性指标(如最畅销的汽车型号)。
概率的计算步骤
- 确定关注的事件和所有可能事件的总数。
- 统计特定事件发生的次数。 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



