Rosalind第30题——ros_bio30_SSEQ

最新推荐文章于 2022-11-03 16:09:22 发布

他城她糖i

最新推荐文章于 2022-11-03 16:09:22 发布

阅读量203

点赞数

分类专栏： ROSALIND答案文章标签： Fasta文件子串搜索位置记录最小间隔生物信息学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_45380519/article/details/119708483

版权

ROSALIND答案专栏收录该内容

35 篇文章

订阅专栏

如果第一次阅读，请查看写在前面

import re

#读取fasta文件
with open('../examples/ros_bio30_SSEQ.txt') as f:
    file = f.readlines()
table = {}
for line in file:
    line = re.sub(r'\n', '', line)
    m = re.match(r'^>.*', line)
    if m:
        name = m.group()
        table[name] = ''
    else:
        table[name] += line

#取出fasta中的母串和子串
all_seq = []
for value in table.values():
    all_seq.append(value)
seq = all_seq[0]
subseq = all_seq[1]

#将子串中各字符的位置与字符一同生成一个字典
all_loc = {}
for j in subseq:
    all_loc[j] = []
    for i in range(len(seq)):
        if seq[i] == j:
            all_loc[j].append(i+1)
print(all_loc)

#寻找各个字典中位置的最小值，且各位置列表中的最小值都要比前一个列表最小值大
location = [x for x in all_loc.values()]
temp = min(location.pop(0))
sloca = str(temp)
num = len(location)
i = 0
while i < num:
    if min(location[i]) > temp:
        sloca += ' ' + str(min(location[i]))
        temp = min(location[i])
        i += 1
    else:
        location[i] = [x for x in location[i] if x > min(location[i])]
print(sloca)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。