Rosalind第12题——ros_bio12_GRPH

他城她糖i

于 2021-07-27 17:32:35 发布

阅读量114

点赞数

分类专栏： ROSALIND答案文章标签：生物信息学

本文链接：https://blog.youkuaiyun.com/qq_45380519/article/details/119149245

版权

ROSALIND答案专栏收录该内容

35 篇文章

订阅专栏

如果第一次阅读，请查看写在前面

import re
#将fasta文件存为字典后转化为列表
fasta = {}
with open("../examples/ros_bio12_GRPH.txt") as f:
    file = f.readlines()
for line in file:
    line = re.sub("\n", "", line)
    m = re.match(r'^>.*', line)
    if m:
        name = m.group()
        fasta[name] = ''
    else:
        fasta[name] += line
name = list(fasta.keys())
sequence = list(fasta.values())

#通过双层循环遍历序列，判断序列后三位与其余序列前三位是否相等
adjacency = []
index = 0
i = 0
while i < len(sequence):
    j = 0
    while j < len(sequence):
        if name[i] == name[j]:
            j += 1
            continue
        if sequence[i][-3:] == sequence[j][:3]:
            adjacency.append(name[i] + ' ' + name[j])
            index += 1
        j += 1
    i += 1
for line in adjacency:
    print(line)
#print(adjacency)