背景
有过预测与启动子序列互作的转录因子的想法,最近alphafold3发布,便试图使用alphaflod3看看能不能进行初步筛选。
大批量预测需要提交许多序列,在网页端一个个粘贴不现实,于是alphafold sever提供了JSON文件上传接口。
不过,alphafold sever虽然提供了利用JSON文件批量上传job的接口,但是却限制每天能执行的job数量为20个,在前几天还只是10个。
alphafold sever网站:https://golgi.sandbox.google.com/
提供一个JSON文件创建脚本
alphafold团队在github上提供了json文件的模板,我也只是对着抄一下,把代码贴出来能给像我这样的小白用户节约几个小时的时间。
目标:创建一个JSON文件,功能是创建n个jobs,分别预测每一个转录因子与目标启动子序列的互作。
1 准备目标物种的转录因子数据集
从Plant Transcription Factor Database网站下载,链接为:https://planttfdb.gao-lab.org/,棉花中有5000个转录因子。如何查找,请参考其他教程。
2 获得差异表达基因的启动子序列
3 使用python创建JSON文件
import json
# 1把fasta文件拆分成为字典并储存在列表中
sequences_data = []
current_id = None
for line in open('/mnt/d/bioinfor/database/陆地棉转录因子/Ghi_pep_51.txt', 'r'):
if line.startswith('>'):
if current_id is not None:
# 把cur

最低0.47元/天 解锁文章





