1、我有一个变量,我认为它应该是一个混杂因素,但它并不显著。我应该将它纳入分析吗?
对于某些变量(如年龄或性别),我们可能有充分理由认为它们可能是混杂因素,即便在特定分析中不显著,也应保留在分析中,因为它们可能会改变主要自变量的效应。
2、如果因变量是0或1,会发生什么情况?
当因变量为0或1时,因变量的对数几率不存在,这可能会使一些人认为在这种情况下无法进行逻辑回归。但实际上模型使用的是 期望值 的对数几率,而非观测值,模型能确保期望值大于0且小于1。
在协变量仅为分类变量,结果可用比例而非0/1表示的情况下, 未分组 和 分组 分析会得出完全相同的结果。
3、a) 给出协方差分析所做的三个假设。b) 有什么证据表明这些假设可能不成立?c) 对比两个置信区间。d) 人们可能还想看到数据的哪些其他图表?e) 为什么调整基线的影响这么小?
a) 假设如下:
i) 基线和结果之间存在线性关系;
ii) 无论基线值如何,针灸都能减少头痛天数(即所有受试者的治疗效果相同);
iii) 模型的残差相互独立,且近似服从具有恒定方差的正态分布。
b) 数据的标准差相对于均值较大,表明数据可能是偏态的。数据还被限制在最小值 0 和最大值 28 之间,这也可能导致偏态。
c) 协方差分析的置信区间比 F 检验的置信区间大,这表明基线和随访之间的关联很弱,引入协变量实际上增加了标准误。
d) 人们可能希望看到:
- 数据分布的图表
- 两个组的基线与随访对比图
- 实际随访对象的基线值
人们可能还想看看在基线时,失访者与随后被随访者是否存在差异。按治疗组绘制的残差点图有助于确认两组的残差是否合理地服从具有相似方差的正态分布。
e) 纳入基线因素对结果影响不大,因为治疗组和对照组在基线时具有可比性,但关键在于实际随访对象在基线时是否可比。
4、a) 描述分娩因素对BSS满意度评分的影响。有什么意外发现吗?b) 模型检验的p值说明了什么?c) 标准化系数能告诉读者什么?d) 关于总产程长度做了什么假设?e) 在逐步回归中使用诸如硬膜外麻醉这样的分类变量存在什么问题?f) 会阴三度撕裂系数是与什么进行比较的参考?g) 既然逐步回归剔除了第一产程和第二产程的长度,这两个产程长度就不重要了吗?h) 该模型在解释满意度方面表现好吗?
a) 硬膜外麻醉比无麻醉或其他麻醉方式满意度低;尿道周围撕裂会带来更多满意度;总产程每增加一个单位(以小时计),满意度下降0.01;会阴三度撕裂会使满意度大幅降低,尿道周围撕裂带来更多满意度较意外。
b) 整体 p 值为 0.045,表明该模型仅略优于随机解释数据的能力。
c) 标准化系数表明模型中最重要的因素是使用硬膜外麻醉。
d) 模型假设满意度随产程长度线性下降,但未验证。
e) 逐步回归中,当其他类别被剔除时,系数的含义会改变,如硬膜外麻醉现在是与其他麻醉方式和无麻醉方式的组合进行对比。
f) 会阴三度撕裂与所有非三度撕裂情况对比,包括一度、二度撕裂和无撕裂情况。
g) 第一产程和第二产程长度与总产程长度高度相关,若知道总产程长度,一、二产程长度对满意度无额外信息。
h) 调整后的 R² 为 19.4%,表明该模型对母亲满意度的解释能力有限。
5、对比粗略相对风险(RR)和总体风险比。为什么会存在差异?
总体模型的粗略相对风险为 4.7 / 3.5 = 1.34,而调整模型的风险比为 1.51。差异可能是由于感染/未感染 Alpha 变异株人群之间的混杂因素不同。作者指出,大多数 Alpha 变异株病例出现在英格兰南部和东部,且发生在随访后期。
6、受阿尔法变异株影响的人群住院率更高这一结论是否严重依赖于比例风险假设?
否,例如结果是按每个年龄类别以及总体给出的,因此不需要对年龄和风险之间的关系做任何假设,如风险呈线性增加。此外,作者已经表明对于其他风险,风险大致成比例。

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



