孟德尔随机化

从医学统计学关联到因果关系

在这里插入图片描述

随机对照实验是医学研究的金标准,但是开展难度较大。孟德尔遗传的证据等级介于队列研究和随机对照研究之间。

在这里插入图片描述

![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/a27c64c4e0a647bc95f61843e67a85cf.png

孟德尔随机化的原理:用基因型(SNP)作为工具变量,来研究中间表型和疾病之间的关联性。

在这里插入图片描述
在这里插入图片描述

孟德尔随机化例子

基因型SLC2A9与尿酸有关(基于文献),同时SLC2A9也与缺血性心脏病无关。该基因型与年龄、性别等混杂因素无关。借助这个模型就可以研究尿酸与缺血性心脏病的关系。
在这里插入图片描述

孟德尔随机化的步骤为:

①找工具变量,从其他研究中挑选特定基因作为工具变量,从基因库中挑选需要的和暴露相关的基因变量SNPs。
②估计工具变量对结局的作用,工具变量对结局的作用也是从所有的研究中估计出来的整体效应,这样可以拒绝单个研究的偏倚。
③合并多个SNP的效应量,效应量是得到暴露和结局因果效应的前提。
④用合并后的数据进行孟德尔随机化分析和相应的敏感性分析。

孟德尔随机化的统计方法包括:

①逆方差加权法(inverse variance weighted.Ivw):IVW是MR在分析多个SNP时对多个位点效应进行Meta汇总的方法。IVW的应用前提是所有的SNP均为有效的工具变量且相互之间完全独立。
②加权中位数估计(Weighted median,WM):WM为所有的个体SNP效应值按照权重排序后得到的分布函数的中位数。当至少50%的信息来自于有效的工具变量时,WM可得到稳健的估计值。
③MR-Egger法:MR-Egger不强制回归直线通过原点,允许纳入的工具变量存在定向的基因多效性。当回归截距不为零且P for intercept <0.05时表明基因多效性的存在。
④MR-PRESSO法:可以通过排除异常值(outliers)排除特定的SNP以获得更加接近真实值的估计值。

例子

研究肥胖和二型糖尿病的直接因果关系遇到如下挑战:1),高血压和高血脂等因素与肥胖、二型糖尿病都有关系,肥胖可能是通过高血压和高血脂等因素去导致二型糖尿病,而本身与二型糖尿病没有直接关系;2),现有数据只能表明肥胖和二型糖尿病有强相关性,无法证明是肥胖引起了二型糖尿病,还是二型糖尿病引起了肥胖。

孟德尔随机化的解决方案是:找出与肥胖强相关的SNP位点(扮演着肥胖的代理人的角色),根据这些SNP位点对二型糖尿病患者进行分组(有该等位基因vs.无该等位基因),这样就可以认为是随机分组(因为非同源染色体上的非姐妹染色单体交叉互换是随机的),并且这样的分组排除了混杂因素的干扰(因为这些SNP位点与混杂因素无关)。

如果直接根据肥胖与否进行分组的话就有下面的问题:1),高血压和高血脂等因素与肥胖有关,在分组的时候要考虑这些混杂因素;2),肥胖组中可能有二型糖尿病导致的肥胖患者(因果关系比较难说清楚)。

在这里插入图片描述

官网分析流程

在这里插入图片描述

Reference

https://www.sohu.com/a/666661861_121118947
https://gwaslab.org/2021/06/24/mr/
https://blog.youkuaiyun.com/weixin_43843918/article/details/136063754
https://blog.youkuaiyun.com/weixin_43843918/article/details/137787561

### 孟德尔随机化的概述 孟德尔随机化是一种利用遗传变异作为工具变量来评估暴露因素与结局之间因果关系的方法。这种方法基于遗传变异在受精卵形成过程中被随机分配这一原理,从而减少混杂偏倚的影响[^1]。 #### 高级孟德尔随机化课程推荐 对于希望深入了解并应用孟德尔随机化方法的学生或研究人员来说,郑老师的高级孟德尔随机化课程提供了一个全面的学习平台。该课程涵盖了多变量孟德尔随机化、药物靶点分析以及中介效应分析等内容,适合那些希望通过此技术撰写高质量学术论文的人群。 #### 初学者入门指南 即使是没有编程经验的研究者也可以通过参加专门设计的零基础教学课程迅速上手。这些课程通常会介绍如何从头开始进行数据分析,并帮助学员掌握当前热门的科研写作技巧,以便能够高效产出研究成果[^2]。 #### 数据来源实例 一项具体的应用案例展示了来自中山大学的一组科学家仅仅依靠两样本孟德尔随机化策略,在BMJ子刊发表了他们的发现。这表明即使是相对简单的研究框架也能带来重要的科学贡献。 另外,《发文新思路》一文中提到的一个实际例子说明了如何结合国家健康和营养检查调查(NHANES)数据库与其他基因组关联研究(GWAS)资源来进行更复杂的双向双样本孟德尔随机化分析,最终成功投稿至影响因子较高的期刊[JAD (IF=6.6)] [^4]。 #### 统计学背景支持 当涉及到具体的统计测试时,理解背后的理论至关重要。例如,在处理分类数据时经常使用的卡方检验,其核心理念在于比较观察频次(Oi)与期望频次(Ei),并通过计算得出一个服从特定自由度下卡方分布的概率值。这种类型的推断统计广泛应用于生物学领域内的各种场景之中,比如验证豌豆植株表型比例是否符合经典遗传规律等情形[^3]。 ```python import scipy.stats as stats # Example Chi-Square Test Calculation observed = [50, 70] expected = [60, 60] chi_statistic, p_value = stats.chisquare(f_obs=observed, f_exp=expected) print("Chi-square statistic:", chi_statistic) print("P-value:", p_value) ``` 上述代码片段演示了如何使用Python执行基本的卡方适配度检验操作过程。 ### 结语 综上所述,无论是初入行的新手还是寻求进一步提升技能的老手,都可以找到适合自己水平的相关学习材料和技术指导方案。借助合适的教育资源和支持体系,任何有志于探索这一前沿领域的人都能顺利完成自己的毕业项目或者职业发展目标。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值