机器学习中的概率与逻辑回归:从理论到实践
1. 肿瘤收缩研究与逻辑回归基础
在研究影响肿瘤收缩的因素时,研究人员将对象分为两组,一组使用安慰剂,另一组使用大麻素。相关数据如下表所示:
| 分组 | 肿瘤收缩(是) | 肿瘤收缩(否) | 总和 |
| — | — | — | — |
| 大麻素 | 60 | 6833 | 6893 |
| 安慰剂 | 130 | 6778 | 6909 |
| 总和 | 190 | 13611 | 13801 |
基于这些数据,我们可以进行一系列的计算和分析。
1.1 真实优势比相关计算
- 样本优势比 :样本优势比 $\hat{\theta}$ 的计算公式为 $\hat{\theta} = \frac{130 \times 6833}{60 \times 6778} = 2.1842$。
- 样本对数优势比 :通过对样本优势比取对数得到。
- 95%置信区间 :对于真实对数优势比,其 95%置信区间为 $0.7812 \pm 1.96 \times 0.1570 = (0.4734, 1.0889)$;相应地,真实优势比的 95%置信区间为 $(e^{0.4734}, e^{1.0889}) = (1.6060, 2.9710)$。
1.2 逻辑回归中的基本概念
- 优势的定义 :成功的优势定义为成功概率
机器学习概率与逻辑回归解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



