` 生信自学记录1——获取Fastq格式的反向互补序列
总共分为三步
1.读取基因序列的str格式,返回反向互补序列str
2.打开fastq格式的文本提取基因序列,返回互补序列list
3.读取互补序列的list替换原基因序列,返回反向互补后的fastq格式的文本
具体代码如下:
1.读取基因序列的str格式,返回反向互补序列str
def to_reverse(str):#获得目的序列的反向互补序列
str1=list(str)
str1.reverse()
str2=''
for i in str1:
if i in ['A','a']:
str2+='T'
elif i in ['T','t']:
str2+='A'
elif i in ['c',"C"]:
str2+='G'
elif i in ['G','g']:
str2+="C"
elif i in ['U','u']:
str2+='A'
else:
print('please check your gene_sequence')
return str2
2.打开fastq格式的文本提取基因序列,返回互补序列list
def get_geneSeq(fq):#获取目的fasta文件的目的序列,并得到目的序列的反向互补序列
list_reverse=[]
for i in range(len(fq)):
if i%4==1:
try:
r_seq=to_reverse(fq[i])
list_rever