概率(probability)和似然(likelihood),都是指可能性,都可以被称为概率,但在统计应用中有所区别。
- 概率(probability):用于在已知模型的情况下预测新的数据。
例如:抛一枚匀质硬币,抛10次,6次正面向上的可能性多大?
- 似然(likelihood):给定已知数据来拟合模型,或者说给定某一结果,求某一参数值的可能性。
例如:抛一枚硬币,抛10次,结果是6次正面向上,其是匀质的可能性多大?
下面看一个例子(来自:StatQuest: Probability vs Likelihood.)
假设下面这个分布是老鼠体重的分布,是一个均值为32,标准差为2.5的正态分布。

我们随机称一只老鼠的体重,其体重在32到34克的概率(probability)等于曲线在32到34的面积。在本例中,曲线的面积是0.29,意味着随机称一只老鼠,会有29%的概率其体重落在32到34克之间。在数学上,我们用下面的符号表述:
P r ( 体 重 在 32 到 34 之 间 ∣ 均 值 = 32 , 标 准 差 = 2.5 ) = 0.29 Pr(体重在32到34之间|均值=32 ,\; 标准差=2.5)=0.29 Pr(体重在32到34之间∣均值=32,

概率和似然是统计学中的两个关键概念,虽然都涉及可能性,但使用场景不同。概率用于已知模型预测新数据,例如硬币抛掷的正面向上的可能性。而似然则是给定观测数据来评估模型参数的可能性,如根据观测到的硬币正面向上的次数判断硬币是否均匀。在概率公式中,Pr(条件|模型)表示在特定模型下的概率,而似然公式L(模型|数据)则表示给定数据时模型的合理性。通过理解这两者的差异,能更好地进行统计推断和模型选择。
最低0.47元/天 解锁文章
845

被折叠的 条评论
为什么被折叠?



