python文本处理,将RNA转换为蛋白质

本文介绍了一个Python函数,该函数将给定的RNA序列转换为其对应的氨基酸序列。通过使用标准的遗传密码子表,函数能够从输入的RNA序列中每三个核苷酸一组进行读取,并将其转化为相应的氨基酸符号。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

def translate_rna(sequence):
    # 密码子表
    codonTable = {
        'AUA': 'I', 'AUC': 'I', 'AUU': 'I', 'AUG': 'M',
        'ACA': 'T', 'ACC': 'T', 'ACG': 'T', 'ACU': 'T',
        'AAC': 'N', 'AAU': 'N', 'AAA': 'K', 'AAG': 'K',
        'AGC': 'S', 'AGU': 'S', 'AGA': 'R', 'AGG': 'R',
        'CUA': 'L', 'CUC': 'L', 'CUG': 'L', 'CUU': 'L',
        'CCA': 'P', 'CCC': 'P', 'CCG': 'P', 'CCU': 'P',
        'CAC': 'H', 'CAU': 'H', 'CAA': 'Q', 'CAG': 'Q',
        'CGA': 'R', 'CGC': 'R', 'CGG': 'R', 'CGU': 'R',
        'GUA': 'V', 'GUC': 'V', 'GUG': 'V', 'GUU': 'V',
        'GCA': 'A', 'GCC': 'A', 'GCG': 'A', 'GCU': 'A',
        'GAC': 'D', 'GAU': 'D', 'GAA': 'E', 'GAG': 'E',
        'GGA': 'G', 'GGC': 'G', 'GGG': 'G', 'GGU': 'G',
        'UCA': 'S', 'UCC': 'S', 'UCG': 'S', 'UCU': 'S',
        'UUC': 'F', 'UUU': 'F', 'UUA': 'L', 'UUG': 'L',
        'UAC': 'Y', 'UAU': 'Y', 'UAA': '', 'UAG': '',
        'UGC': 'C', 'UGU': 'C', 'UGA': '', 'UGG': 'W',
    }
    proteinsequence = ''
    # 3个3个取
    for n in range(0, len(sequence), 3):
        if sequence[n:n + 3] in codonTable.keys():
            # 把匹配到的字典的键值加入到蛋白质字符窜
            proteinsequence += codonTable[sequence[n:n + 3]]
    return proteinsequence


se = "AUGGCCAUGGCGCCCAGAACUGAGAUCAAUAGUACCCGUAUUAACGGGUGA"  # sequence
print(translate_rna(se))

MAMAPRTEINSTRING

 

转载于:https://www.cnblogs.com/lmt921108/p/8023182.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值