统计模型、聚类与轨道模型解析
1. 统计模型与估计
1.1 线性回归模型
线性回归模型的一般形式为:
[m = Fp + c + ε, E [ε] = 0, Var [ε] = V = G^{-1}]
其中,(m) 是 (n×1) 的观测向量,(F) 是已知的 (n×m) 模型矩阵((m ≤ n) 且满秩),(p) 是 (m×1) 的模型参数向量,(c) 是已知常数偏移,(ε) 是 (n×1) 的观测误差向量,期望为 0,协方差矩阵为 (V)。
最小二乘法(LS)估计 (p) 需要最小化目标函数:
[S(p) = (m - Fp - c)^T G (m - Fp - c)]
最小二乘估计量 (\tilde{p}) 及其协方差矩阵 (C) 为:
[\tilde{p} = (F^TGF)^{-1}F^TG(m - c), C = (F^TGF)^{-1}]
(\tilde{p}) 是无偏估计量,且在所有观测值的线性函数估计量中具有最小协方差矩阵。若 (ε) 服从多元正态分布,则该估计量是有效的。
回归的残差 (r) 定义为:
[r = m - c - F\tilde{p}, R = Var [r] = V - F (F^TGF)^{-1}F^T]
标准化残差 (s)(在高能物理中也称为“pulls”)为:
[s_i = \frac{r_i}{\sqrt{R_{ii}}}, i = 1, …, n]
若模型指定正确,“pulls” 的均值为 0,标准差为 1。
回归的卡方统计量定义为:
[\chi^2 = r^TGr, E[\chi^
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



