RNA-seq是近些年发展起来的针对转录组的测序技术,其能够获得mRNA、smallRNA以及各种非编码RNA的序列。在不同细胞或者在相同细胞的不同发育阶段细胞中这些RNA的表达水平是不同的,依赖RNA-seq测序技术对这些不同细胞进行差异表达分析,可以得出转录组层面上的表达模式,当前已广泛应用于基础研究、临床诊断和药物研发等领域。
文章目录
1.数据质控
由于当前的测序方法需要再测序样品的两端加上接头,以便于进行大量非特异性扩增以及高通量测序,因此测序结果首先要进行去接头和质控处理。数据质控即包括去接头和质控处理两部分,可以进行数据质控的工具有FastQC、cutadaptor、Trimmomatic、Trim galore等,其中较常见的是Trim galore。
2.mapping
进行数据质控后需要将获得的序列mapping回基因组,用于mapping的工具也有很多如tophat、Bowtie、hisat2、BWA等。几个工具正hisat2和Bowtie使用较多,Bowtie使用时较为节省内存并且超级快速,其并不只是一个简单的拼接工具,其适合的工作是将小序列mapping到大基因组上。hisat2速度也很快,也较为常用。
3.确定RNA丰度
确定各种RNA的丰度是非常重要的。不同样品间可以使用TMM值、upper quartile值来计算,同种样品则可以使用RPKM、quantile值进行比较。可以使用的工具有htseq-count或stringtie、Bedtools、GFold等。
4.差异基因表达分析
差异表达分析用于确定各RNA表达差异是否有显著性,差异分析的工具有CuffDiff、DEseq、EdgeR等,每种工具都有一定的特点如CuffDiff更适合于不同样本间的比较,而另外两种更适合于相同样本的比较。获取到差异分析结果后,还可以选择使用GO分析或者KEGG通路分析进行后续分析,用于确定这些差异表达代表的生物学意义。
叮!
当前除了RNA-seq外还有sRNA-seq、miRNA-seq、chip-seq、甲基化测序等测序技术,但是这些测序技术后续的生信处理的原理基本相似。本

RNA-seq是一种针对转录组的测序技术,通过测序mRNA、smallRNA及非编码RNA,分析不同细胞或同一细胞不同发育阶段的RNA表达模式。本文介绍RNA-seq的数据质控、mapping、RNA丰度确定及差异基因表达分析等步骤,适用于基础研究、临床诊断和药物研发。
最低0.47元/天 解锁文章
3534

被折叠的 条评论
为什么被折叠?



