Plink群体分层(Population Stratification)算法

        以GWA tutorial中数据说明。

一、读取IBS数据构建距离矩阵

1) 读取HapMap_3_r3_13.genome文件中的DST列数据,前几行如下:

注意:这里dst实际上时个体间在所有经质控后SNP位点上总IBS占位点数的比例。

2)将dst数据按(1-dst)*(1-dst)转换成个体间距离。比如,0.720708变成0.078004,这样得到DMatrix.txt数据,前几行如下:

3)上述矩阵双中心化:计算每行的平均数mi及中总平均数m, 每个元素转换成-0.5(xij - mi - mj + m)。中心化矩阵前几行如下:

二、求中心化矩阵的特征值和特征向量

设特征值为L1、L2等,对应的特征向量为V1、V2等,那么L1^0.5*V1就是HapMap_3_r3_13_mds.mds文件中的C1列,L2^0.5*V2就是C2列,等等。

三、Mathematica验算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值