上周遇到一个比较麻烦的项目。物种是一种酵母菌,参考基因组是组装的,并没有像样的gtf文件,使用genemark-ES生成注释文件后,需要对差异基因进行注释。本来之前有一个脚本能够很流畅地处理这个步骤。然而,由于genemark-ES自动生成的geneID在perl脚本中存在bug,个人对perl又不是很熟悉,因此重新写了一个脚本,用于差异基因与注释文本的匹配注释,下面直接上脚本。
import csv
genome_file = open('C:/Users/bbplayer/Downloads/genemark7.gtf','r') #读取注释文件
diffgene_file = open('C:/Users/bbplayer/Downloads/geneDEsign_results.csv','r') #读取差异基因文件
genome_line = genome_file.readlines() #按行读取
diffgene_line = csv.reader(diffgene_file)
newgtf_name = 'difftmp'
desktop_path = 'C:/Users/bbplayer/Downloads/'
file_path = desktop_path+newgtf_name+'.gtf' #对输出文件路径和name进行设置
file = open