第三代测序成本偏高是什么原因导致的?
是看了这道题下面的邹捷萌回答:现在基因测序的瓶颈主要在哪里?精度?速度?
在精确度方面第三代测序已经很高了,但目前国内生物实验室的测序还是以二代为主,推测成本可能是主要原因(维基百科:二代Illumina $0.05-0.15 per 1 million bases,三代$0.33-$1.00per 1 million bases),所以暂不考虑其他因素,想知道这样的成本是什么原因呢?
最主要原因是通量低,二代测序一次几十Gb数据量,三代测序(以pacbio为例)一次仅300Mb,而单次运行的成本基本上在一个量级。
所以单碱基成本差了百倍。
如果通量能保证,那错误率高不是问题,每个分子都多测几次总能相互校正过来的,但这个前提是需要牺牲通量。
pacbio如果想要将准确率提升到二代测序平台的水品,那么通量将进一步降低至原来的五分之一以下。
泻药,对三代测序不是很了解,但据说目前的准确度还很低,可能是目前的技术针对单分子信号的检测还不够灵敏,想想也是理所当然的,要检测单个分子水平的反应技术上肯定有很多难点,要攻克这些技术瓶颈自然要投入很高的研发成本,仪器很可能也会用到某些特殊材料也会增加成本,也可能用到特殊的试剂等等都会导致最终测序成本高。
但只要技术一旦成熟,上下游产业链打通,成本都会很快降下来,二代测序包括sanger测序都是这样。
ps:以上纯属个人猜测。。
重要的是reads长度吧?二代因为reads短,拼接不得不需要大量数据,再怎么优化算法最终结果有时候还是靠运气。运气不好gap太多只能抱着一对数据哭了。
作者:Tang Boyun
链接:https://www.zhihu.com/question/25409882/answer/42891213
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
利益相关:是 这话题本想保持中立的,但最后不得不引一些PacBio内部资料来证明一些观点,有倾向性?必然的。这些资料的读者一般是Top Scientist,而非普通大众,所以自行衡量吧。
很多人认识错误,PacBio三代测序最大的死穴是:通量不足。如果通量不是限制因素,那么PacBio是目前最准确的测序方式:错误率可以无限接近罕见突变的发生率(即无法分辨是测序错误还是罕见突变)。因为三代的错误是完全随机发生的,可以靠覆盖度来纠错,而如果系统错误,这是不可纠正的。一图展现区别:
以下这幅图的数据来源:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3443046/figure/F2/
那么为何三代通量不足?技术瓶颈了,这要从三代测序原理说起。PacBio三代测序基本单位叫做SMRT Cell,它是这样的:
实际有效面积,接近成人的大拇指指甲,在这个面积上,均匀分布着15万个小孔。