#1.输入数据
# genome:
# genome.fasta
#
# rnaseq data:
# name.rna.1.fastq.gz
# name.rna.2.fastq.gz
#
# homolog.fasta
#2.bam文件准备
hisat2-build -p 20 genome.fasta name
hisat2 -p 24 -x name-1 name.rna.1.fastq.gz -2 name.rna.2.fastq.gz -S name.rna.sam
samtools sort --threads 24 -m 4G -o name.rna.sort.bam name.rna.sam
samtools index name.rna.sort.bam
#3.braker.pl,得到augustus.hints.gtf
braker.pl --species=name --genome=genome.fasta --bam=name.rna.sort.bam --prot_seq=homolog.fasta --cores 24 --prg=gth --gth2traingenes --etpmode --softmasking
#4.格式处理
perl -e 'while (<>) { if (m/\tCDS\t/) { print; s/\tCDS\t/\texon\t/; print; } elsif (m/\ttranscript\t/) { next; } elsif (m/^#/) { next; } elsif (m/\tgene\t/) { next; } elsif (m/\tintron\t/) { next; } else { print; } }

最低0.47元/天 解锁文章
5354

被折叠的 条评论
为什么被折叠?



