简化基因组的测序方法

RAD-Seq(restriction site-associated DNA sequencing)最开始指的是2008年发表在PLOS ONE上“Rapid SNP discovery and genetic mapping using sequenced RAD markers"提出的方法,目前该文章的引用已经达到1200+,现在指代的是一系列基于限制性内切酶的测序技术。同样在概念上被引申的还有GBS(genotyping-by-sequencing),只不过GBS的名字不能让你直接把它和限制性内切酶联想起来.总之,如果现在公司给你推荐GBS或RAD-seq时,可能未必和你想的一样,你需要仔细问下他们的建库手段。毕竟手段不同,你的实验设计,操作和结果都会发生变化。这是RAD-seq相关方法的历年引用情况

img_8dd685250c76451949aae458c816b3ff.jpe
不同RAD-seq技术引用情况

RAD-seq虽说方法很多,但是文库构建流程大致如下,不同方法在其中某些步骤存在差异

  • 起始基因组DNA量:能否允许降解FNA
  • 限制性内切酶酶解:限制酶种类,数量
  • 酶切位点结合接头:接头类型
  • 酶解片段大小选择:直接选择,间接选择
  • 添加barcode混池:视v接头而异
  • 测序类型选择:单端,双端

两者的差异在于,1)是现进行酶切然后随机破碎,最后仅选择存在酶切位点片段测序;2)也是酶切,但是后续直接选择合适大小的片段测序。

因此相对于1)测序的位点平均会少一点,也就会导致同一批样本后者利用率低于前者。无参考基因组更推荐前者,而不是后者。

img_8d8dfa0df1b2694b7ad775de12ede9a0.jpe
不同方法的数据利用率

原始RAD-seqs

最先提出的RAD-seq技术流程,也就是RAD-seq的冠名技术,分为如下几步:

  1. 基因组DNA用限制性内切酶裂解, 然后连接到P1接头。P1接头里含有正向扩增和Illumina测序引物位点,以及4~5 bp 的核酸barcode. barcode至少大于3 bp。
  2. 之后接头连接的片段(adapter-ligated fragments)混池,随机打断
  3. DNA随后连接到P2接头,反向扩增扩展引物无法连接P2. P2是一种Y型接头,包含P2反向扩增引物位点的反向互补序列,使得不含P1接头的片段无法扩增。(Y型接头的工作原理)
  4. 最后仅有同时含P1和P2接头的片段能够上机测序。
img_7ca3dbc371fdfc4310284862aa047137.jpe
RAD-seq protocol

Genotyping-by-Sequencing

GBS比原始的RAD-seq步骤更加简单

  1. 将不同样本和含不同barcode接头成对放在平板里
  2. 使用ApeKI限制酶进行酶解
  3. 使用T4连接酶,将接头连接到片段两端因酶切产生的粘末端(stcky end)
  4. 将含不同barcode的样本混池,随后过片段长度筛选柱,过滤尚未反应的接头
  5. 加入PCR引物,进行PCR扩增

这里没有直接对片段进行筛选,但是PCR扩增时优先扩增小片段

img_1a360f0b50bbc30884274e32e8ffb624.jpe
Genotyping-by-Sequencing流程

ddRAD-seq

ddRAD-seq和GBS相似,两者都不需要在加接头后进行随机打碎,GBS通过PCR扩增的方式过滤了大片段,而ddRAD-seq通过双酶切的方式,然后筛选固定长度来选择合适大小的片段

img_cfd6d60bf0129819706f8c5890e667f5.jpe
ddRAD-seq和RAD-seq的不同

常见方法的比较

其实这些RAD-seq文库制备方法可以简单的分为两类:

  • 1)对单酶切位点邻近片段测序,如最初的RAD-seq
  • 2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing

下面是常见的物RAD-seq方法比较

方法原始RAD2bRADGBSddRADezRAD
控制位点的方法选择限制酶选择限制酶选择限制酶选择限制酶和片段大小选择阈值选择限制酶和片段大小选择阈值
位点数/Mb30~50050~10005~400.3~20010~800
位点长度300bp 或1kb contig33–36 bp< 300 bp< 300 bp<300 bp
barcode费用/样本
添加barcode难度/样本中等
是否用到专利试剂盒
识别PCR重复使用双端测序不能使用降解的barcode用降解的barcode不能
特殊的设备超声破碎仪Pippin Prep或普通的跑胶仪Pippin Prep或普通的跑胶仪
是否适用复杂和大基因组中等
是否适用无参考基因组中等中等中等

参考文献

  • RAD-seq: Rapid SNP discovery and genetic mapping using sequenced RAD markers
  • GBS: A Robust, Simple Genotyping-by-Sequencing (GBS) Approach for High Diversity Species
  • ddRAD-seq: Double Digest RADseq: An Inexpensive Method for De Novo SNP Discovery and Genotyping in Model and Non-Model Species
  • 2011 NATURE REVIEWS | GENETICS:Genome-wide genetic marker discovery and genotyping using next-generation
  • 2016 NATURE REVIEWS | GENETICS:Harnessing the power of RADseq for ecological and evolutionary genomics
基因组测序流程通常包括多个步骤,从样品的收集到数据的分析。以下是一个典型的宏基因组测序流程的描述: 1. **样品收集**:从环境中收集样品,例如土壤、水体、空气或生物体样本。 2. **DNA提取**:从样品中提取总DNA。这一步通常需要使用特定的试剂盒或方法,以确保DNA的完整性和纯度。 3. **DNA片段化**:将提取的DNA随机打断成较小的片段。这一步可以通过物理方法(如超声波)或酶促反应来实现。 4. **文库构建**:将片段化的DNA连接到测序接头,形成测序文库。文库构建过程中通常会进行PCR扩增,以提高DNA的浓度。 5. **测序**:使用高通量测序技术(如Illumina、Ion Torrent或PacBio)对文库进行测序测序生成大量的短读长序列数据。 6. **数据质控**:对测序数据进行质量控制,去除低质量的读长和接头序列。这一步可以使用工具如FastQC和Trimmomatic。 7. **组装和注释**:将高质量的读长组装成更长的序列(如contigs或scaffolds),并进行功能注释。常用的组装工具包括SPAdes和MEGAHIT,注释工具如Prokka和MetaGeneMark。 8. **数据分析**:对组装和注释后的数据进行进一步分析,如物种分类、功能基因的鉴定和丰度分析。常用的工具包括Kraken2、MetaPhlAn2和HUMAnN2。 9. **结果可视化**:将分析结果进行可视化展示,如生成物种分布图、功能基因热图等。可视化工具如R语言的ggplot2和Python的Matplotlib。 以下是一个简化的宏基因组测序流程图: ``` 样品收集 --> DNA提取 --> DNA片段化 --> 文库构建 --> 测序 --> 数据质控 --> 组装和注释 --> 数据分析 --> 结果可视化 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值