摘要
上周崴脚,一周在家办公,效率较低,没有输出文章,今天来个大的。本篇文章为入职后第一次完成RNA-Seq全流程项目分析后进行的内容梳理,有一些地方依靠师姐(公司导师)已经完成的perl脚本,个人并不是很能看懂,部分细节还没有完全打通。之后可能会自己用python(也可能是shell)重写之后再慢慢补充。
第一部分
step.1 下载数据
百度网盘下载数据
查看gz压缩格式的内容:zcat 18134R-49-01_S0_L001_R1_001.fastq.gz z | head -n 10
step.2 数据质控
批量去除接口
mkdir trim
for i in *_R1_001.fastq.gz;