贝叶斯调查分析:多级扩展解读
1. 泊松模型
在调查分析中,我们常常会遇到事件计数数据。例如:
- 某人在过去4年的投票次数,可能是0、1、2、3、4次。
- 某人在过去一个月的购物次数,如0、1、2、3、4次。
- 某人在过去一年看医生的次数,像0、1、2次。
这些计数可能是个人特征(如教育程度、收入和年龄,这些都属于一级变量)的函数。同时,调查对象还可能受到种族同伴压力和生活方式等二级因素的影响。比如,约四分之一的西班牙裔和四分之一的非裔美国人认为医生不当行为是一个严重问题,这种观念会影响他们看医生的频率。此外,医疗诊所的特征,如停车情况、诊所内实验室、是否接受保险、医护人员的礼貌和尊重程度以及隐私保护措施等二级特征,也会对看医生的次数产生影响。
这些计数例子都遵循泊松过程,基本的泊松过程如下:
[Y_i \sim Poisson(\theta_i)]
[\theta_i = exp(\beta_0 + \beta_1 \times X_i)]
其中,(X_i) 是个人属性。
在泊松模型中,方差等于均值,没有独立的方差参数 (\sigma_i^2)。这意味着实际方差可能比模型预测的更大,这种情况被称为过度分散,因为没有方差参数来捕捉数据中的变化。
泊松模型可以扩展以处理多级数据:
[Y_i \sim Poisson(\mu_i e^{\beta \times X_i + \epsilon_i})]
[\epsilon_i \sim N(0, \sigma_{\epsilon}^2)]
其中,(\sigma_{\epsilon}^2) 用于捕捉过度分散,当
超级会员免费看
订阅专栏 解锁全文

1059

被折叠的 条评论
为什么被折叠?



