python处理fasta文件,ID和序列放在一行

本文介绍了一个用于处理FASTA格式文件的Python脚本,该脚本能将ID号与序列合并为同一行,并从中提取特定ID的目标序列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#!/usr/bin/python
#-*- coding:utf-8 -*-
"处理fasta文件,将ID号和序列放在一行"
import sys
with open(sys.argv[1]) as f:
    fw=open('out.fasta', 'w')
    line=f.read()
    line=line.replace('\n', '').replace('>', '\n>')
    for aa in line:
        fw.write(aa)
    fw.close()
"""
>chr1|hos107.1#gene1
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.4#gene3
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.5#gene4
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
"""
"""
>chr1|hos107.1#gene1ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.4#gene3ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.5#gene4ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
"""

#提取目标序列
f=open('./out.fasta', 'r')
fw=open('target.fasta', 'w') 
for line in f.readlines():
    if line.startswith('>chr1|hos107.1'):
        fw.write(line)
f.close()
fw.close()


"""可以从上述处理好的单行文件out.fasta中提取指定目标ID的文件,并将其
写入到target.fasta文件中"""

#整体思路:
#先统一fasta文件格式从test.fasta----out.fasta
#取出目标ID序列:out.fasta----target.fasta

 

转载于:https://www.cnblogs.com/lmt921108/p/8023209.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值