基因分析与蛋白质结构预测技术全解析
1. 多基因风险评分计算
多基因风险评分(PRSs),也被称为多基因分数(PGSs)或基因组分数,可用于预测表型,如特征或疾病。其计算方法是将一个人拥有的风险等位基因数量乘以相应的效应大小(通过全基因组关联研究(GWAS)对表型进行估计),然后求和。公式如下:
[PRS = \sum_{i=0}^{N} \beta_i * dosage_i]
其中,$N$ 是分数中遗传变异或单核苷酸变异(SNV)的数量,$\beta_i$ 是变异 $i$ 的效应大小(也称为 beta),$dosage_i$ 是研究对象中 SNV $i$ 的拷贝数。
目前,可在 PGS Catalog 获取多基因风险评分目录,其中包含近 550 种特征的 2600 多个多基因分数。不过,多基因风险评分并非完全准确,例如对于身高的遗传力,目前只能解释一半。而且,复杂疾病是基因型和环境因素共同作用的结果,因此该评分具有一定的指示性,与环境因素结合使用时效果更佳。
1.1 安装 PLINK 2.0
可使用以下命令安装 PLINK 2.0:
wget https://s3.amazonaws.com/plink2-assets/alpha3/plink2_linux_avx2_20220603.zip
unzip alpha3/plink2_linux_avx2_20220603.zip
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



