数据模型验证与可视化方法解析
1. 逻辑回归模型的自助法验证
1.1 逻辑回归模型基础
逻辑回归模型(LRM)依赖一个重要假设:二元因变量 Y(通常取值为“是”和“否”,或数值 1 和 0)的对数几率是定义 LRM 的预测变量的线性函数,即 (LRM = b_0 + b_1X_1 + b_1X_2 + \cdots + b_nX_n)。将对数几率 (Y = 1) 转换为 (Y = 1) 的概率的公式为:(1) 除以 (\exp(-LRM)),其中 (\exp) 是指数函数 (e^x),(e) 约为 (2.718281828\cdots)。
不过,标准的 Hosmer - Lemeshow(HL)检验在确认拟合的 LRM 是否为正确模型时并不可靠,因为它在检查模型拟合时无法区分非线性和噪声,并且对多个数据集较为敏感。
1.2 自助法验证方法
自助法验证方法有两个主要作用:一是衡量 LRM 预测对数据中小变化(随机扰动)的敏感程度;二是在存在的情况下,提供一种选择最佳 LRM 的程序。自助样本是通过有放回抽样从原始(训练)数据中随机抽取得到的,模型构建者基于各种自助样本重复进行逻辑回归建模。具体步骤如下:
1. 稳定的自助法 LRM :如果自助法得到的 LRM 在形式和预测上都稳定,模型构建者可以从候选(自助法)LRM 中选择一个作为最终模型。
2. 不稳定的自助法 LRM :若自助法得到的 LRM 不稳定,模型构建者可以采取以下两种措施:
- 向原始数据中添加更多数据。
- 抽取一个更大的新样本作为训练数据。然后在追加的
逻辑回归与可视化技术解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



