Stata的负二项回归与零膨胀回归命令

本文介绍了在数据分析中,如何利用负二项回归(nbreg)和零膨胀模型(zinb、zip)来处理含有过多0值的数据。负二项回归适用于因变量具有过度dispersion的情况,而零膨胀模型则针对0值过多的问题,如商品评论的点赞数量。文章通过实例展示了如何使用Stata进行这两种模型的估计,并强调了如何通过forcevuong选项比较模型效果,以确定最佳模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 负二项回归 nbreg

nbreg – Negative binomial regression

nbreg depvar [indepvars] [if] [in] [weight] [, nbreg_options]

Example

nbreg like stars text_len sentiment polarity, vce(cluster business_id)

在这里插入图片描述

  • 不报告常数项
nbreg y x1 x2 x3, noconstant 

2.零膨胀负二项回归 zinb

在一些场景下,0 取值的频率很高,无法使用普通泊松分布解释,于是出现了所谓零膨胀问题。比如,商品评论的点赞数量大部分为零,可能因为评论本身无意义,也可能因为大多数人看完评论后不会去选择点赞。

zinb – Zero-inflated negative binomial regression

zinb depvar [indepvars] [if] [in] [weight], inflate(varlist[, offset(varname)]|_cons) [options]
  • inflate(var):var用于解释产生过多0值的原因
  • forcevuong: 用于比较 zinb和nb的模型效果
  • forcevuong不能与 vce() cluster standard error 同用, 可先比较两个模型后再聚合标准误
zinb like sentiment polarity , inflate(stars text_len) forcevuong

在这里插入图片描述

此处比较zinb和nb模型效果 Pr>z=0, 则表明zinb模型效果更好


3. 零膨胀泊松回归 zip

zip – Zero-inflated Poisson regression

zip depvar [indepvars] [if] [in] [weight], inflate(varlist[, offset(varname)]|_cons) [options]

Example

zip like sentiment polarity , inflate(stars text_len) forcevuong

在这里插入图片描述

参考来源:ZIP-too many Zero:零膨胀泊松回归模型

### 如何在 Stata 中实现负二项回归模型 #### 负二项回归简介 负二项回归是一种广义线性模型,适用于因变量为计数数据的情况。当泊松回归无法满足过离散(overdispersion)假设时,可以考虑使用负二项回归来建模。 #### 数据准备 为了进行负二项回归分析,在Stata中首先需要准备好相应的数据集并加载到工作环境中[^1]。 ```stata use "your_dataset.dta", clear ``` #### 建立负二项回归模型 通过`nbreg`命令可以在Stata中建立负二项回归模型。该命令允许指定响应变量以及一系列预测因子。 ```stata nbreg count_variable independent_var1 independent_var2, irr ``` 上述代码中的`count_variable`代表的是作为反应变量的计数值;而`independent_var1`, `independent_var2`则是解释变量列表;选项`irr`表示报告发生率比率而不是系数估计值。 #### 结果解读 执行完以上指令之后,将会得到一组统计输出结果,其中包括各个参数的估计及其显著水平等信息。这些可以帮助理解不同因素对于事件发生的频率有何影响。 #### 进一步操作 如果想要获取更多诊断信息或者尝试其他类型的拟合优度检验,则可以通过附加不同的选项或后续命令完成: - 显示似然比卡方测试的结果以评估整体模型性能: ```stata lrtest . (quietly nbreg count_variable independent_vars) ``` - 对特定协变量的影响做边际效应分析 ```stata margins, dydx(independent_var_of_interest) ``` #### 实际案例应用 假设有这样一个场景:研究者希望了解某些社会经济特征如何作用于个人每年就诊次数上。此时就可以采用负二项回归来进行定量描述,并借助Stata平台快速获得所需结论。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值