基因病例对照关联研究中基因分型错误率无调用减少与样本量损失之间的权衡
1. 引言
单核苷酸多态性(SNP)基因分型可用于病例对照设计,通过2x3卡方独立性检验来测试SNP标记与疾病之间的关联。基因分型通常基于潜在的连续测量值,并将其分类为不同的基因型。有时会采用“无调用(no - call)”程序,即不分类临界观测值。这一程序既能降低基因分型错误率,又会减少观测到的基因型数量,而这两个因素都会影响统计检验的效力。
在基因分型中,由于连续测量值需归为三种基因型(AA、AB、BB),部分值的分类可能存在歧义。“无调用”程序就是针对这种情况,不给出受试者的基因型。与之相对的是“全调用(all - call)”程序,即给所有受试者分配基因型,即便部分可能有误。
一些技术使用单变量或双变量正态分布的混合模型进行基因型分类。例如,Perkin Elmer软件SNPscorer使用了一种椭球模型。通过适当投影,双变量模型可简化为单变量正态分布的混合模型。
此前研究表明,基因分型错误率的增加会导致检验效力下降。“无调用”程序的初衷是,降低基因分型错误率带来的效力提升能抵消因观测基因型数量减少导致的效力损失。本文将开发计算方法,研究这一权衡关系。
2. 材料与方法
2.1 符号说明
| 变量类型 | 变量名称 | 含义 |
|---|---|---|
| 计数变量 | $N_{case}$ | 假设无基因型 |
基因分型中无调用规则的权衡
超级会员免费看
订阅专栏 解锁全文
3795

被折叠的 条评论
为什么被折叠?



