摘要
基因变异能够影响顺式调控元件(如启动子)的活动,导致特定细胞类型中的基因表达变异,可能造成疾病。论文研究了天然遗传变异如何单独条件或者协同调节顺式调控元件,从而影响基因表达。
一些名词
启动子:基因的一部分,控制基因表达(转录)的起始时间和表达的程度,启动基因转录。
终止子:终止转录。
外显子:真核细胞的基因在表达过程中能编码蛋白质的核苷酸序列,在蛋白质生物合成过程中被表达为蛋白质。
SNP:在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。可由单个碱基的转换(transition)或颠换(transversion)所引起。SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。
genotyping:基因分型,鉴定生物个体的基因型。
accessible chromatin:可及性染色体。
ATAC-seq:一种捕获染色质可及性(染色质开放性)的测序方法。
peak of ATAC-seq:被Tn5转座酶切开、没有被组蛋白结合、染色质开放的DNA位点,如果是TF结合的区域,一般会有一个山谷般的存在。
结论
- Peaks of accessible chromatin与独特的基因组特征相关,并富含与自身免疫疾病相关的SNP。
- Peaks of accessible chromatin提供了对转录因⼦ (TF) 结合的频率和单核苷酸分辨率⾜迹的估计。
- 染色体的co-accessibility可能由基因组的3D构象决定,可能对应多个顺式调节元件的协调调节,包括已知的T细胞增强子和受先导因子约束的区域。
- 将遗传变异与个体峰值可及性的变异相结合,能够确定了局部-ATAC-QTL。尽管只有少数(5%) 的局部 ATAC-QTL 直接存在于已发现的 TF 核⼼基序中,但预计近⼀半 (45%) 会显著破坏 TF 结合位点的结合。
- 局部 ATAC 峰中⾃⾝免疫疾病位点的压倒性富集,可能是因为致病变异倾向于⼲扰含有在特定细胞类型,或状态中活跃的关键 TF 的顺式调节元件。
- 局部 ATAC-QTL 可以进⼀步作⽤于 1 Mb 窗⼝中的其他峰,对可共同访问的 ATAC 峰的影响最强。
方法
研究对象:参加表型遗传学研究 8 的 18 ⾄ 56 岁(平均 29.9 岁)的志愿者,无炎症性疾病、⾃⾝免疫性疾病、慢性代谢紊乱或慢性传染病病史。
基因分型:在基因型插补后,提取了 105 个⼈的基因型,以检测染⾊质可及性和基因表达。额外去除MAF小于0.05的SNP,对4558693和4421936个常见变体进行染色质可及性和基因表达检测。
数据
处理后的 ATAC-Seq 和 RNA-Seq 数据可从 GEO 获得,注册号为 GSE86888。
原始 ATAC-Seq 和 RNA-seq fastq 和基因分型数据可从登录 phs000815.v1.p1 下的dbGAP获得。
处理的原位 Hi-C 测序数据可从 GEO 获得,注册号为 GSE115980。