我的第一次RNAseq分析

本文记录了作者首次进行RNAseq分析的过程,从接收fastq文件开始,通过预处理去除不合格reads,然后使用特定基因组文件进行比对。涉及的工具有生物学数据处理和服务器资源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从师姐那儿拿到了整个大概的protocol

0. 预处理。  将公司给的fastq格式的文件变成clean.fastq。去掉一些不合格的reads

1.比对。 运用以下命令生成一个参考基因组。我有师姐之前留下的基因组文件,名叫GCF_000002035.5_GRCz10_genomic.fna,我也不知道这是个什么格式。从ensemble上下载的目标基因组是.fa格式的。

cd /public/home/iemb315/Danio_genome
/public/opt/sc/program/STAR-STAR_2.4.1c/source/STAR \
--runThreadN 12 --runMode genomeGenerate --genomeDir ./ \--genomeFastaFiles ./GCF_000002035.5_GRCz10_genomic.fna
得到:
 
[iemb315@node100 ~/Danio_genome]$ls -shl
total 15G
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 Aligned.out.sam
8.0K -rw-rw-r-- 1 iemb315 iemb315 6.2K Mar  8 09:56 chrLength.txt
 24K -rw-rw-r-- 1 iemb315 iemb315  22K Mar  8 09:56 chrNameLength.txt
 16K -rw-rw-r-- 1 iemb315 iemb315  16K Mar  8 09:56 chrName.txt
 12K -rw-rw-r-- 1 iemb315 iemb315  12K Mar  8 09:56 chrStart.txt
1.3G -rw-rw-r-- 1 iemb315 iemb315 1.3G Mar  6 21:51 GCF_000002035.5_GRCz10_genomic.fna
1.6G -rw-rw-r-- 1 iemb315 iemb315 1.6G Mar  8 10:30 Genome
4.0K -rw-rw-r-- 1 iemb315 iemb315  538 Mar  8 09:55 genomeParameters.txt
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 indexForCFpe100.log
104K -rw-rw-r-- 1 iemb315 iemb315 104K Mar  8 10:30 Log.out
   0 -rw-rw-r-- 1 iemb315 iemb315    0 Mar  6 22:23 Log.progress.out
4.0K -rw------- 1 iemb315 iemb315  234 Mar  6 22:23 nohup.out
 11G -rw-rw-r-- 1 iemb315 iemb315
RNA-seq(全称RNA测序)是一种常用的技术,用于研究基因表达水平。在进行rnaseq数据分析之前,需要安装一些特定的软件工具链,包括: 1. **生物信息学平台**: - **STAR** 或 ** HISAT2**:用于转录组比对,将测序读取与参考基因组进行配对。 - **TopHat2** 或 **BWA-MEM**:另一种常用的比对工具。 2. **基因计数** 和 **转录本组装** 工具: - **HTSeq**、**featureCounts** 或 **StringTie**:计算每个基因或外显子的表达量。 - ** salmon** 或 **kallisto**:快速无参转录本组装和定量。 3. **表达量量化** 和 **差异表达分析**: - **DESeq2** 或 **edgeR**:统计显著性分析,找出差异表达的基因。 - **limma** 或 **voom**:类似的功能,适用于微阵列数据。 4. **可视化工具**: - **GenePattern**、**IGV** 或 **UCSC Genome Browser**:帮助用户查看基因位置、比对结果以及表达数据的图形化展示。 5. **软件管理**: - **conda** 或 **bioconda/bioconda-recipes**:用于创建和管理生物信息学软件环境。 安装步骤通常是通过包管理器如`conda` (推荐) 或者 `pip` 进行的,例如: ```sh # 使用 conda 安装 conda create -n rna_seq_env -c bioconda STAR tophat2 featureCounts salmon # 使用 pip 安装 pip install -r requirements.txt # 如果有相应的requirements文件 ``` 安装过程中可能会涉及依赖项的处理和权限设置。务必查阅每种工具的官方文档,因为有些软件可能需要特定版本或配置才能运行。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值