40、逻辑回归与儿童白血病持续缓解预测

逻辑回归与儿童白血病持续缓解预测

1. 逻辑回归中的估计方法

1.1 完全或准完全分离的检测

在逻辑回归中,标准误差变得更合理时,对于单个协变量 X,可通过对其值排序并与 Y 值比较,轻松检测完全或准完全分离。若有多个协变量,可使用 Santner 和 Duffy 提出的算法来确定最大似然估计是否存在。在实际数据集中,完全或准完全分离并不常见,因为其出现几乎只要求二分协变量。但在小样本或稀疏数据集的回归中估计多个参数时,分离出现的概率不可忽略。

对于二分协变量,可通过分析相应的列联表来检测分离。以神经生理学为例,我们想确定运动神经元影响下肌梭放电的预测因素。感兴趣的协变量包含在求和与恢复函数中,可通过逻辑回归模型同时研究这些协变量对系统放电的影响。在α运动神经元数据集的情况下,常用软件包大多失败,因为最大似然估计不存在。这是因为协变量 Xt - 13 取值为 1 的所有观测都出现在输出尖峰缺失(Y = 0)时,列联表中 Xt - 13 = 1 且 Y = 1 的单元格为空,单个频率为零的单元格表明存在准完全分离,这会导致最大似然估计出现问题,出现极端估计值和非常大的标准误差。

1.2 精确逻辑回归

精确逻辑回归由 Cox 于 1970 年提出,其参数估计基于消除似然函数中剩余的参数,并以其充分统计量为条件。似然函数可表示为:
[P(Y_1 = y_1, Y_2 = y_2, \ldots, Y_n = y_n) = \frac{\exp(\sum_{s = 0}^{p} \beta_s t_s)}{\prod_{i = 1}^{n} (1 + \exp(x_i \beta))}]
其中
[t_s = \

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值