昨天写了一篇GWAS模型的笔记,今天把模型再细化一下。
一般线性模型GLM(General Linear Model):y = Xα + Zβ + e
混合线性模型MLM(Mixed Linear Model):y = Xα+ Zβ + Wμ+ e
y: 所要研究的表型性状;
Xα:固定效应(Fixed Effect),影响y的其他因素,主要指群体结构;
Zβ:标记效应(Marker Effect SNP);
Wμ:随机效应(RandomEffect),这里一般指个体的亲缘关系。
e: 残差
举例:(MLM模型)
假设的研究背景
研究某种作物的产量与其基因标记(SNPs)、环境因素、施肥量和灌溉情况之间的关系。分析中使用了 3 个样本的数据来演示模型的计算。
数据描述
- 样本数量: 3 个
- SNP 标记数量: 3 个
- 固定效应变量: 环境类型、施肥量、灌溉情况
- 固定效应系数: 每个变量对应一个系数
- 亲缘关系: 样本之间的遗传相似性
- 残差: 未解释的变异
矩阵和向量
1. 表型数据(假设的实际产量,单位:kg)
y = [104, 82, 63]