
现今的生信领域几乎就是和无数的序列打交道,而这些序列的来源就是如今风靡的高通量测序技术,现今的测序不论是测RNA、DNA、miRNA还是ChIP-Seq等等,都是基于NGS(二代测序,next-generation sequencing)的技术发展而来的,目前最为常用的就是illumina公司的测序技术,当然除了illumina公司外还是有其它二代测序技术存在的,ABI公司也有SOLiD测序技术。而之所以被称为二代测序,是因为比一代测序技术提升了非常多,具体体现在速度、准确性、效率等等方面。
由于序列对于生信行业的重要性,我认为了解基本的测序技术的原理是非常必要的,这也有利于生信技术人员了解到测序序列的特点和测序序列中可能出现的问题,了解到现今测序技术的局限性,甚至提出意见改进测序技术。因此本文会简要介绍当今最常用的illumina测序技术的测序原理。
基因文库制备(sample prep)
制备测序基因文库是最初始的一步,这里我不过多解释文库,简要解释文库就是一个包含你所要测序的所有基因序列的集合体。测序过程中的基因文库的制备是将要测序的样本经过序列片段化(fragmentation)、再将这些片段化后得到的所有短序列的两端加上接头,从而将要测序的序列制备成为一个有很多拥有相同双端序列,但内部序列不同的序列片段集合体。具体步骤如下图。
图自:https://max.book118.com/html/2017/0924/134913788.shtm

解释一下图中的步骤:
- 首先将要测序的序列或者基因组等使用nebulisation(雾化)或者sonification(超声)再或者是酶学方法处理,即可得到片段化后的DNA序列,每个片段大概200-300bp。
- 片段化后的序列很大几率是拥有末端凸出的序列,并不是完整的配对状态,因此需要使用酶将其末端补平。
- 再使用酶在序列的平末端两端各加上一个A(腺嘌呤)尾。
- 通过上一步加上的A尾,illumina公司制作的接头(adapter)很容易加在序列的两端。
- 通过上面的步骤,制作步骤就结束了。但是需要提升测序序列的数量从而提高测序的准确性,也使后续的序列拼接步骤较为方便。因此最后还需要进行PCR操作扩增基因文库中序列的数量。由于每个序列的两端都有接头,因此设计的引物只需要和接头配对即可,十分方便。
有博客中写到文库制作是有两次序列片段化的过程的,这个具体我不是很清楚,但是实际上操作是一样的,只是会重复某些步骤而已。有兴趣的人可以去看这篇文章
这里要提一下加上的接头序列,一个序列片段加上接头后即变成如图的序列:

图自:https://www.cn-healthcare.com/articlewm/20210110/content-1179325.html
- 原始的序列在③处,而③之外的两端各为一个接头。
- ①处为后续会使用到的区域,暂时先不解释。
- ②处是测序时会使用到的片段,测序时发挥功能的引物是和②处配对的,配对后向中间部分(即③,要测序的序列)扩增序列,从而达到边合成、边测序(sequenc

本文详细介绍了Illumina测序技术的工作流程,包括基因文库制备、序列簇生成和测序过程。在基因文库制备阶段,DNA样本经过片段化、接头添加和PCR扩增等步骤形成测序文库。序列簇生成过程中,DNA片段在流动槽的纳米井中通过桥式PCR形成序列簇,以便于荧光检测。测序时,采用边合成边测序的方式,通过读取荧光信号获取序列信息。数据处理阶段则涉及对测序结果的分析和质量控制。整个过程揭示了二代测序技术的高效性和准确性。
最低0.47元/天 解锁文章
5947





