最大似然与显著性检验全解析
1. 模型与似然基础
1.1 模型结构
模型是描述数据的结构,主要由两部分构成:
- 第一部分:将解释变量线性组合,形成线性预测器,再通过链接函数转换,得到结果变量的预测值或拟合值。
- 第二部分:描述结果变量围绕预测值的概率分布。
1.2 二项式模型与似然
以生育男孩的概率为例,假设事件发生概率为 π。若有 5 位准妈妈,生下 2 个男孩和 3 个女孩,男孩出生于 1 号和 3 号母亲。若 π 是生男孩的概率,该事件序列发生的概率为 π × (1 - π) × π × (1 - π) × (1 - π)。若母亲有不同特征,可将第 i 位母亲生男孩的概率写为 πi,生女孩的概率为 (1 - πi),该序列的概率为 π1 × (1 - π2) × π3 × (1 - π4) × (1 - π5),此概率被称为该特定事件序列的似然,记为 L(π),即给定模型下数据的概率 P(D|M)。
最大似然过程是选择使似然最大化的 π 值。这里考虑两种极端情况:
- 情况一:所有 π 相同,无区分个体的信息。此时 L(π) = π²(1 - π)³ ,一般若 N 次生育中有 D 个男孩,则 L(π) = πᴰ(1 - π)ᴺ⁻ᴰ。由于似然值通常很小,常用其自然对数代替,即 logₑ[L(π)] = D logₑ(π) + (N - D) logₑ(1 - π)。使似然最大化的 π 值与使对数似然最大化的 π 值相同。
- 情况二:每个 π 由数据决定,可根据结果是男孩或女孩选择 π。如 π1 = π3 = 1,π2 = π4 = π5 = 0,这是饱和模型,参数数量达到最大(与数据
超级会员免费看
订阅专栏 解锁全文
2010

被折叠的 条评论
为什么被折叠?



