目录
0. 质控
这一步主要看接头,其他由于 ERCC 等等原因,会和 fastqc 提供的正常报告有区别。
0.1 使用 fastqc 批量质控
find ./RAW/ERR*fastq.gz | xargs ./app/fastqc -t 6 -o ./fastqc_result
0.2 使用 multiqc 整合 fastqc 的结果
cd fastqc_results
multiqc .
firefox multiqc_report.html
- 用firefox之前的登录记得要用 ssh -X
1. 比对
如果有 spike-in,参考基因组应该加上 spike-in 的序列,同时,gtf 文件也要加上 spike-in。
spike-in fasta和gtf的下载地址
cat ERCC92.fa >> GRCh38.fa
cat ERCC92.gtf >> GRCh38.annotation.gtf
1.1 比对并查看比对质量
nohup ls *gz | while read id; do STAR --runMode alignReads --runThreadN 4 --readFilesIn ${id} --outFileNamePrefix ../alignment_result/${id%%.*} --genomeDir ../ref --readFilesCommand zcat; done > alignment.log 2>&1 &
# 整合多个文件的总reads数,比对率等等
ls *.final.out | while read id; do (cat ${id} |sed '1i ID |'${id%%.*} |

本文详细介绍RNA-seq数据从质控、比对到下游分析的全流程,包括使用fastqc和multiqc进行批量质控,STAR比对工具的参数设置及结果评估,利用featureCounts生成计数矩阵,以及scater包在R中的应用进行单细胞数据质控。
最低0.47元/天 解锁文章
5004

被折叠的 条评论
为什么被折叠?



