根据Uniprot ID/PDB ID批处理获取蛋白质.pdb文件

该博客介绍了如何通过UniprotID批量下载对应的PDB文件,利用Alphafold的URL进行批处理,并展示了代码实现。同时提到了可以使用RCSB的URL获取PDB文件。此外,博主还表达了在学习dssp处理过程中遇到的困难。

1.根据Uniprot ID批处理获取蛋白质.pdb文件

由于Uniprot的ID号可能对应多个NCBI的ID,但是根据Alphafold可以获取其唯一的PDB文件,所以用代码批处理获得.pdb文件如下:

import pandas as pd
import numpy as np
from Bio import SeqIO
from Bio import PDB
import requests

# 但是可能会出现 InsecureRequestWarning 警告,
# 虽然不影响代码采集但是看着不舒服,可以加上下面两行:
import urllib3
urllib3.disable_warnings()

headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:95.0) Gecko/20100101 Firefox/95.0'}

def read_file(file_name):
    pro_swissProt = []
    with open(file_name, 'r') as fp:

        for line in fp:
            if line.startswith('>'):#作用:判断字符串是否以指定字符或子字符串开头
                pro_swissProt.append(line[1:-1])
    return pro_swissProt

file1 = '/AD/all1.csv'

ID=read_file(file1)

j = 0
not_exist_list = []

for i in ID:
    j = j + 1
    print(j)
    print(i)
    url = 'https://alphafold.ebi.ac.uk/files/AF-'+i+'-F1-model_v1'+'.pdb'
    print(url)

    r = requests.get(url, headers=headers, verify=False)
    with open('/AD/Information/PDB
评论 12
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值