基因多态性与肺癌风险的研究方法及实例分析
1. 研究设计与样本量计算
在研究基因多态性与疾病关联时,控制人群的相关参数设定十分关键。其中,P0 是一个由基因多态性定义的高危人群患病率所决定的关键参数,其值取决于所研究的基因,范围在 1%至 50%之间。研究中要检测的优势比(OR)需设定在合理范围内,对于这些基因而言,OR 值约为 2.0 比 5.0 更现实,且检测 OR 为 2.0 所需的样本量比 OR 为 5.0 时大得多。同时,还需定义统计误差概率,标准值为显著性水平 5%(α = 0.05)和检验效能 80%(β = 0.20)。若要测试多个基因,可通过将显著性水平 α 除以基因数量或主要假设的测试数量来进行多重比较调整。
以一个基因的功率计算为例,假设某基因的纯合变异基因型比野生型纯合子或野生型/变异杂合子具有更高的癌症风险,变异纯合子的患病率估计为 P0 = 20%,且病例和对照数量相同。为了在显著性水平 α = 0.05 和检验效能 80%的条件下检测到 OR 为 2,总共需要 n = 269 名可评估患者,即 n = 135 例病例和 n = 135 例对照。若将 OR 放宽到 3,则仅需 n = 50 例病例和 n = 50 例对照。若患病率高于 20%,如 P0 = 40%,则样本量分别从 269 和 100 降至 208 和 84。这些计算使用了 PASS 2002 的逻辑回归样本量程序。
以下是不同条件下所需样本量的对比表格:
| OR 值 | P0 = 20% 样本量 | P0 = 40% 样本量 |
| ---- | ---- | ---- |
| 2 | 269 | 208 |
| 3 | 100 | 84 |
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



