生信自学记录1——获取Fastq格式的反向互补序列

最新推荐文章于 2024-04-03 08:53:54 发布

原创

最新推荐文章于 2024-04-03 08:53:54 发布 · 1.6k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #生物信息分析

本文记录了使用Python进行生物信息分析的过程，主要涉及如何从Fastq格式文件中提取基因序列，生成反向互补序列，并将这些序列应用回Fastq文件，从而得到反向互补后的Fastq格式文本。通过三步实现，包括读取序列、生成互补序列及替换原序列。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

` 生信自学记录1——获取Fastq格式的反向互补序列

总共分为三步
1.读取基因序列的str格式，返回反向互补序列str
2.打开fastq格式的文本提取基因序列，返回互补序列list
3.读取互补序列的list替换原基因序列，返回反向互补后的fastq格式的文本

具体代码如下：
1.读取基因序列的str格式，返回反向互补序列str

def to_reverse(str):#获得目的序列的反向互补序列
    str1=list(str)
    str1.reverse()
    str2=''
    for i in str1:
        if i in ['A','a']:
            str2+='T'
        elif i in ['T','t']:
            str2+='A'
        elif i in ['c',"C"]:
            str2+='G'
        elif i in ['G','g']:
            str2+="C"
        elif i in ['U','u']:
            str2+='A'
        else:
            print('please check your gene_sequence')
    return str2

2.打开fastq格式的文本提取基因序列，返回互补序列list

def get_geneSeq(fq):#获取目的fasta文件的目的序列，并得到目的序列的反向互补序列
    list_reverse=[]
    for i in range(len(fq)):
        if i%4==1:
            try:
                r_seq=to_reverse(fq[i])
                list_rever