Regulatory genomic circuitry of human disease loci by integrative epigenomics
前言
这次分享的是今年2月发表在nature的一篇文章。在分子水平注释人类疾病仍然是一个挑战,因为93%与疾病相关的突变位点位于基因组的非编码区域,而这些区域如何调控基因的转录和翻译仍然未知。为此,来自麻省理工学院的研究人员基于多个大型合作基因组图谱项目(包括ENCODE、Roadmap Epigenomics、Genomics of Gene Regulation)的数据,提出了一个新的人类表观基因组图谱,命名为EpiMap(Epigenome Integration across Multiple Annotation Projects)。1.EpiMap: Methodological overview and contributions

文章的主要贡献:
- 基于多个表观遗传修饰信号注释了染色质状态(chromatin states),同时结合DNA可及性注释增强子;
- 将增强子分为不同的模块(enhancer modules),并根据转录因子motif和GO富集结果推断每个模块的上游调控转录因子和下游远程调控基因;
- 整合增强子位置,增强子和基因的远程交互作用和GWAS SNP结果,预测SNP的靶基因和组织特异性;
- 将GWAS性状划分为“单因子”和“多因子”性状,揭示了它们与疾病的关系;
- 区分了“单效”和“多效”位点,并发现得分最高的位点通常有多个驱动突变,通过不同的方式发挥“多效”功能:多个增强子和一个共同的靶基因、调控单个组织中的多个基因或多个组织中发挥功能。
EpiMap首先使用统一的数据处理流程分析了来自859个样本的3,030个数据集,并另外使用算法估算出了14,952个数据集。接着基于多个表观遗传修饰信号注释了染色质状态(chromatin states),同时结合DNA可及性注释增强子;在833个生物样本中定义了基于H3K27ac的局部活性水平,并基于此将增强子分为300个增强子模块(enhancer modules),包括290个组织特异性模块和10个广泛活跃的模块。并根据转录因子motif和GO富集结果推断每个模块的上游调控转录因子和下游远程调控基因;结合表观基因组-转录组的相关性以及增强子与邻近基因的距离,研究人员预测了增强子-基因交互(enhancer-gene links)。接下来,增强子注释及其组织特异性来解释与复杂性状相关的GWAS位点。最后研究了性状-组织、性状-性状和组织-组织表观基因组GWAS共富集模式,以了解它们之间复杂的相互作用。文章主要分为三个部分介绍,第一部分是数据的产生和验证,数据整理到了并可视化到了网站 compbio.mit.edu/epimap。第二部分是调控基因组相关内容,第三部分是研究表观基因组GWAS共富集模式,了解与疾病的关联。


研究通过整合多个大型基因组图谱项目数据,构建了EpiMap表观基因组图谱,解析了93%与疾病相关但位于非编码区域的突变位点调控机制。通过分析14,000+数据集,定义了300个增强子模块,并预测了GWAS位点的靶基因和组织特异性。
最低0.47元/天 解锁文章
1086





