13、基因病例对照关联研究中基因分型错误率无调用减少与样本量损失之间的权衡

基因分型中无调用规则的权衡

flink9streamer

于 2025-09-28 15:20:51 发布

阅读量10

点赞数

CC 4.0 BY-SA版权

分类专栏：生物计算的演进之路文章标签：基因分型无调用规则病例对照研究

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/flink9streamer/article/details/154861270

生物计算的演进之路专栏收录该内容

61 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基因病例对照关联研究中基因分型错误率无调用减少与样本量损失之间的权衡

1. 引言

单核苷酸多态性（SNP）基因分型可用于病例对照设计，通过2x3卡方独立性检验来测试SNP标记与疾病之间的关联。基因分型通常基于潜在的连续测量值，并将其分类为不同的基因型。有时会采用“无调用（no - call）”程序，即不分类临界观测值。这一程序既能降低基因分型错误率，又会减少观测到的基因型数量，而这两个因素都会影响统计检验的效力。

在基因分型中，由于连续测量值需归为三种基因型（AA、AB、BB），部分值的分类可能存在歧义。“无调用”程序就是针对这种情况，不给出受试者的基因型。与之相对的是“全调用（all - call）”程序，即给所有受试者分配基因型，即便部分可能有误。

一些技术使用单变量或双变量正态分布的混合模型进行基因型分类。例如，Perkin Elmer软件SNPscorer使用了一种椭球模型。通过适当投影，双变量模型可简化为单变量正态分布的混合模型。

此前研究表明，基因分型错误率的增加会导致检验效力下降。“无调用”程序的初衷是，降低基因分型错误率带来的效力提升能抵消因观测基因型数量减少导致的效力损失。本文将开发计算方法，研究这一权衡关系。

2. 材料与方法

2.1 符号说明

变量类型	变量名称	含义
计数变量	$N_{case}$	假设无基因型

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。