全长转录组测序

全长转录组测序

转录组从广义上讲,是指细胞或组织内全部 RNA 的总和,而总 RNA 依据不同的 分类标准有着不同的类型,如依据是否翻译成蛋白而分为编码 RNA (coding RNA)和非 编码 RNA (non-coding RNA);依据长短而分为长 RNA (long RNA, 长度大于 200bp)和短 RNA (small RNA, 长度小于 200bp);依据翻译中行使不同的功能主要分为信使 RNA (message RNA, mRNA)、转运 RNA (transfer RNA, tRNA)、核糖体 RNA (ribosomal RNA, rRNA)。由于 mRNA研究较多,一般的转录组测序主要针对于 mRNA[7],与此同时也可 以测到部分长非编码 RNA (long non-coding RNA, lncRNA)。

二代高通量测序技术在转录组方面的应用被称为 RNA 测序(RNA Sequencing, RNASeq),RNA-Seq 由于其高通量的优势以及日益下降的成本,在转录组方面的应用到现 在在研究领域中已经基本取代了基因芯片(micro array)技术。然而,二代测序首先读长 较短,现在应用最多的是双端150bp测序,测出的片段需要拼接才可以形成转录本,对 于转录本的还原度较差;其次,在建库中经过多次 PCR 扩增,容易造成差异分析中假 阳性概率上升[8]。

三代测序技术尤其是 PacBio 公司基于单分子实时测序技术(Single Molecule Real Time sequencing, SMRT)为转录组打造的全长转录组测序(Isoform Sequencing, Iso-Seq)流 程,已经成为国内外研究中新的热点。其在优势主要表现在读长较长,所测得数据无 需组装从而可以减少拼接错误,但是价格昂贵又限制了其测序通量无法做到像二代数 据一样高[9]。 本研究在分析中选用三代测序技术数据与二代数据相结合,将二代数据与三代数 据混合之后去冗余,而非仅用二代数据进行矫正和定量分析,减少了一般分析中对于 二代数据的浪费。为三代无参转录组测序数据分析提供了新方法。

### PacBio HiFi 转录组测序数据分析工具与方法 #### 数据预处理 对于PacBio HiFi RNA 测序数据,在进行任何下游分析之前,通常需要先执行质量控制和读取校正。HiFi reads由于其高准确性,一般不需要像其他长读长技术那样复杂的纠错流程。然而,仍然建议使用专门设计用于PacBio平台的质量评估软件来过滤低质量序列[^1]。 ```bash # 使用lima去除接头污染并分离全长reads lima --isoseq input.subreads.bam output_prefix ``` #### 参考基因组比对 为了更好地理解转录本结构变化以及表达量差异等情况,可以采用基于参考的方法来进行组装。常用的比对工具有Minimap2或者GraphMap等能够高效处理长片段的特点使得它们非常适合应用于此类研究中。 ```bash minimap2 -ax splice ref.fa hifi_reads.fastq > aln.sam ``` #### 基因定量 完成映射之后,则可通过计算每个已知基因模型上的覆盖度来估计相对丰度水平;这一步骤可借助StringTie、Salmon这类专门为RNA-seq开发的应用程序实现自动化操作,并支持多种输入格式包括SAM/BAM文件作为证据来源提供给后续功能富集测试环节利用。 ```r library(tximport) txi <- tximport(files, type="salmon", txOut=TRUE) ``` #### 新颖转录本发现 除了传统的注释驱动型工作流外,还存在一种无参方式允许探索尚未被记录下来的全新mRNA变体。IsoSeq pipeline正是这样一个强大的解决方案,它不仅限于识别剪切位点多样性还能揭示潜在融合事件的发生位置及其频率分布特征。 ```bash # 运行IsoSeq3聚类算法得到高质量的全长cDNA共识序列 isoseq3 cluster polished CCS file prefix ``` #### 差异表达分析 最后,在获得了可靠的样本间比较基础之上,便能进一步探讨特定条件下哪些分子可能发挥着重要作用。DESeq2 或 edgeR 是两个广泛认可的选择之一,二者均提供了稳健统计检验框架用来筛选显著改变的目标集合以便深入挖掘生物学意义所在。 ```r dds <- DESeqDataSetFromMatrix(countData = counts, colData = sampleTable, design = ~ condition) res <- results(dds) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值