alphaFOLD3批量上传互作预测序列所需JSON文件的准备

背景

有过预测与启动子序列互作的转录因子的想法,最近alphafold3发布,便试图使用alphaflod3看看能不能进行初步筛选。
大批量预测需要提交许多序列,在网页端一个个粘贴不现实,于是alphafold sever提供了JSON文件上传接口。
不过,alphafold sever虽然提供了利用JSON文件批量上传job的接口,但是却限制每天能执行的job数量为20个,在前几天还只是10个。
alphafold sever网站:https://golgi.sandbox.google.com/

提供一个JSON文件创建脚本

alphafold团队在github上提供了json文件的模板,我也只是对着抄一下,把代码贴出来能给像我这样的小白用户节约几个小时的时间。
目标:创建一个JSON文件,功能是创建n个jobs,分别预测每一个转录因子与目标启动子序列的互作。
1 准备目标物种的转录因子数据集
从Plant Transcription Factor Database网站下载,链接为:https://planttfdb.gao-lab.org/,棉花中有5000个转录因子。如何查找,请参考其他教程。
2 获得差异表达基因的启动子序列
3 使用python创建JSON文件

import json  
# 1把fasta文件拆分成为字典并储存在列表中
sequences_data = []
current_id = None
for line in open('/mnt/d/bioinfor/database/陆地棉转录因子/Ghi_pep_51.txt', 'r'):
    if line.startswith('>'): 
        if current_id is not None:  
            # 把cur
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值