摘要
动机:牛津纳米孔技术在基因组甲基化模体分析方面具有巨大潜力,包括全基因组甲基化组分析。然而,我们发现没有足够灵敏并返回确定性结果的甲基化模体检测算法。因此,即使使用最新甲基化分析工具 Nanodisco 中实现的迭代方法,MEME 套件也无法从头提取所有幽门螺杆菌甲基化位点。
结果:我们提出了一种新的高灵敏度方法 Snapper,基于贪婪模体选择算法提取甲基化模体序列。Snapper 在富集过程中不需要手动控制,并且富集灵敏度高于 MEME 与 Tombo 或 Nanodisco 仪器结合使用,这在之前由 PacBio 技术研究的幽门螺杆菌菌株 J99 和代表不同细菌种类的四个外部数据集上得到了证实。我们利用 Snapper 表征了新型幽门螺杆菌 A45 菌株的总甲基化组。至少发现了四个以前未在幽门螺杆菌中描述过的甲基化位点。我们通过实验证实了新的 CCAG 特异性甲基转移酶的存在,并推断出一个编码新的 CCAAK 特异性甲基转移酶的基因。
1、介绍
限制修饰 (R-M) 系统是细菌用来保护自己免受噬菌体入侵的重要机制之一。通常,细菌 R-M 系统根据 R-M 复合物结构分为四组 (I、II、III 和 IV) (Roberts 等人 2015)。尽管所有 R-M 系统的结构不同,但它们都具有一个共同特征:存在位点特异性 DNA 结合域,这些域可识别应被甲基化以防止限制酶活性的特定短 DNA 序列。
牛津纳米孔技术 (ONT) 是一种基于测量纳米孔电流的长读测序技术 (Jain 等人 2016)。ONT 不仅可以检测四种典型的核苷酸碱基,还可以捕获任何可以显着改变测序信号的修饰形式 (Liu 等人 2021)。已经开发了许多旨在准确检测甲基化位置的工具(Stoiber 等人 2016 年,Liu 等人 2019 年,Ni 等人 2019 年,Tourancheau 等人 2021 年)。然而,这些工具在推断甲基化位点序列方面有一定的局限性,尤其是在处理低代表性 DNA 模体时。我们在分析幽门螺杆菌数据时就遇到了这个问题。一般来说,这些工具可以准确检测所考虑基因组中的甲基化位置(Stoiber 等人 2016 年)或预测所选位点的甲基化类型(6mA、5mC 和 4mC)(Tourancheau 等人 2021 年),但我们发现精确识别甲基化模体序列的过程要么不够灵敏,要么需要大量的手动控制。
在这里,我们介绍了一种名为 Snapper 的新工具,它基于 ONT 测序数据对甲基化模体进行高灵敏度识别。该工具主要在 H.pylori J99 测序数据上进行验证,并与 Tombo 和 Nanodisco 进行了比较,后者是具有类似功能的最新仪器。 我们首先选择 H.pylori 物种作为本研究的兴趣对象,因为它是一种独特的生物体,其基因组中显示多达 30 种不同的 R-M 系统(Gorrell 和 Kwok 2017),并且具有能够甲基化腺嘌呤和胞嘧啶的甲基转移酶 (MTases)(Gorrell 和Kwok 2017)。其次,它是一种天然的有机体(Hofreuter 等人 2001),可以很容易地进行修改以确认新推断的 MTase。第三,H.pylori J99 菌株之前已使用 PacBio 测序技术(Krebes 等人 2014)进行了表征,这使我们能够直接将我们的结果与竞争技术进行比较。为了进一步验证该方法,分析了一些外部数据集,以确保 Snapper 能够检测不同细菌类群中的甲基化位点。
为了证明所开发工具的适用性,我们在此使用 Snapper 来表征新的 H.pylori A45 菌株的甲基化组。该方法的特异性还体现在已知特异性的 MTases 基因被破坏的 A45 衍生突变体上。
2 材料与方法
2.1 菌株及培养操作
从一名胃癌患者的胃粘膜活检样本中获得 H.pylori A45 临床分离株(Momynaliev 2009)。该分离株用于获得 MTase 基因缺陷的 hpy、hp91/92、hp1352、hp8 和 hp944 衍生物(补充表 S1)。使用基因敲除方法进行靶向失活程序。H.pylori 突变菌株构建的详细描述可在补充材料 S2 中找到。 质粒载体组装和生产所需的大肠杆菌菌株 Top10 在 37C 下在固体 Luria-Bertani 培养基或液体 Luria-Bertani 培养基中通气(150 rpm)培养。转化程序采用“热休克”转化方案进行 (https://international.neb.com/protocols/2012/05/21/transformation-protocol)。将氯霉素 (8 mg/ml, Panreac, 西班牙) 和卡那霉素 (15 mg/ml, Sigma, 美国) 添加到培养基中进行选择。 在微需氧条件下,在添加了 10% 供体马血清 (PAA Labs, 奥地利) 的哥伦比亚琼脂固体培养基 (Becton Dickinson, 美国) 上,在 37C 下培养幽门螺杆菌菌株 20-48 小时。加入氯霉素 (8 mg/ml) 和卡那霉素 (15 mg/ml) 以选择和传代抗性突变菌株。扩增子细胞转化按照 Belova 等人 (2018) 中所述进行。在微需氧条件下,在 37C 的固体培养基中培养细胞 24 小时。将细胞悬浮液 (109 CFU) 移到新培养皿上,培养 4-5 小时以促进生长。随后,将含有 500 ng DNA 片段的无菌水悬浮液滴加到含有生长细胞的固体培养基表面。然后将培养皿琼脂面朝上放在 CO2 培养箱中 17-20 小时。第二天,将细胞转移到含有相应抗生素的选择性培养基中。使用补充表 S2 中列出的引物组,通过 PCR 验证 4-5 天后在培养皿上发现的克隆为 H.pylori 并含有特定插入片段。对于任何后续测定,所有 H.pylori 菌株均在培养 2 天后从培养皿中收获。用 HBSS 缓冲液 (pH 7.5)(Hank 平衡盐溶液,赛默飞世尔,美国)清洗细胞,然后以 3000 g 的速度离心 10 分钟以沉淀细胞,以便制备基因组 DNA,如前所述。
2.2 DNA 操作
本研究中使用的载体和突变菌株列于补充表 S1 中。所有标准的 DNA 操作方法,例如通过碱裂解分离质粒、限制性内切酶消化和连接,均按照 Sambrook 等人 (1989) 的方案进行。 使用 diaGene 试剂盒从细胞培养物中提取 DNA(diaGene,俄罗斯)制备幽门螺杆菌基因组 DNA。使用 Cleanup Standard Kit(Evrogen,俄罗斯)从琼脂糖凝胶中纯化用于克隆或测序的单个 DNA 片段或 PCR 扩增产物。 DNA 限制酶来自 Fermentas(Thermo Fisher Scientific,美国),并按照制造商的说明使用。
2.3 测序
2.3.1 全基因组扩增
使用 Qiagen REPLI-g 单细胞试剂盒进行全基因组扩增,以排除表观遗传修饰碱基。该方法从 10 ng 输入基因组 DNA 中产生微克 DNA,遵循制造商的指导,在 30C 下扩增 8 小时,然后在 65C 下失活 3 分钟。
2.3.2 Oxford Nanopore
使用 Wizard DNA 提取试剂盒(美国 Promega 公司)分离 DNA,并使用优化的固相可逆固定 (SPRI) 珠子选择大小。 在 Qub