以GWA tutorial中数据说明。
一、读取IBS数据构建距离矩阵
1) 读取HapMap_3_r3_13.genome文件中的DST列数据,前几行如下:
注意:这里dst实际上时个体间在所有经质控后SNP位点上总IBS占位点数的比例。
2)将dst数据按(1-dst)*(1-dst)转换成个体间距离。比如,0.720708变成0.078004,这样得到DMatrix.txt数据,前几行如下:
3)上述矩阵双中心化:计算每行的平均数mi及中总平均数m, 每个元素转换成-0.5(xij - mi - mj + m)。中心化矩阵前几行如下:
二、求中心化矩阵的特征值和特征向量
设特征值为L1、L2等,对应的特征向量为V1、V2等,那么L1^0.5*V1就是HapMap_3_r3_13_mds.mds文件中的C1列,L2^0.5*V2就是C2列,等等。