从0在自己机器上部署AlphaFold 3

本文介绍如何在自己本地机器上安装AlphaFold 3。

在10月份,Google DeepMind的首席执行官Demis Hassabis和高级研究科学家John M. Jumper所领导的团队,利用AI技术成功预测了几乎所有已知蛋白质的结构,开发出备受赞誉的AlphaFold,并因此荣获诺贝尔化学奖,

诺贝尔化学奖授予:AI+蛋白质设计/预测方向诺贝尔化学奖授予:AI+蛋白质设计/预测方向icon-default.png?t=O83Ahttps://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247530919&idx=1&sn=d92429f19cd85628a090932bdf553414&chksm=f90e3df9ce79b4efec6792bd3ebc4479066118077caf328516e6eea011a2b6e049495430ae7d&token=1414917553&lang=zh_CN#rd

11月11日,Google DeepMind公司宣布,科学家们现在可以下载AlphaFold 3代码部署在自己机器上,并在非商业用途中使用这款AI工具,截止2024年11月13日,github已经斩获3.5k stars,


以下是正文。

AlphaFold 3只支持Linux操作系统。

安装时,需要约1TB的磁盘空间来存储数据库(建议使用SSD存储)。需要一块拥有计算能力8.0或更高的NVIDIA GPU(具有更大显存的GPU可以预测更大的蛋白质结构)。

第1步,安装Docker


第2步,为A100安装NVIDIA驱动程序

docker run --rm --gpus all nvidia/cuda:12.6.0-base-ubuntu22.04 nvidia-smi

显示类似结果说明前两步的操作正确无误,


第3步,下载AlphaFold 3源代码

git clone https://github.com/google-deepmind/alphafold3.git

第4步,下载依赖数据库

AlphaFold 3依赖大量蛋白和RNA数据库,包括“BFD small”、“MGnify”、“PDB”、“PDB seqres”、“UniProt”、“UniRef90”、“NT”、“RFam”和“RNACentral”数据库。
通过alphafold3/fetch_databases.py下载和设置这些数据库,
cd alphafold3  #alphafold3是上文步骤3的文件夹
python3 fetch_databases.py --download_destination=<DATABASES_DIR>

注意: 

  • <DATABASES_DIR>不能是alphafold3下的一个文件夹,否则影响后续AlphaFold3 Docker image的build;
  • 整个数据库解压后多达630 GB,需要足够的存储空间,为了防止下载过程断开,建议使用screen或者tmux;
  • 确保<DATABASES_DIR>有755权限,否则会报permissions的错误。

下载成功后,<DATABASES_DIR>文件夹下包含以下问价,

pdb_2022_09_28_mmcif_files.tar  # ~200k PDB mmCIF files in this tar.
bfd-first_non_consensus_sequences.fasta
mgy_clusters_2022_05.fa
nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta
pdb_seqres_2022_09_28.fasta
rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta
rnacentral_active_seq_id_90_cov_80_linclust.fasta
uniprot_all_2021_04.fa
uniref90_2022_05.fa

第5步,获取模型参数

AlphaFold 3的模型参数需要向Google DeepMind申请,获得权限后不能转手、不能商用、输出结果只能自己用......

如果要将结果发表,要遵守一大堆规则(一句话,你不能为所欲为......),


第6步,构建AlphaFold3 Docker容器

构建AlphaFold3 Docker容器,

docker build -t alphafold3 -f docker/Dockerfile .

现在可以使用AlphaFold 3了,

docker run -it \
    --volume $HOME/af_input:/root/af_input \
    --volume $HOME/af_output:/root/af_output \
    --volume <MODEL_PARAMETERS_DIR>:/root/models \
    --volume <DATABASES_DIR>:/root/public_databases \
    --gpus all \
    alphafold3 \
    python run_alphafold.py \
    --json_path=/root/af_input/fold_input.json \
    --model_dir=/root/models \
    --output_dir=/root/af_output

当然也可以使用Singularity替代Docker。

从0在自己机器上部署AlphaFold 3本文介绍如何在自己本地机器上安装AlphaFold 3。icon-default.png?t=O83Ahttps://mp.weixin.qq.com/s/gLq_SESkmoL5k7XaGlLEpQ

### 如何在不同操作系统上安装 AlphaFold3 #### Windows 上的安装方法 对于希望在Windows环境下运行AlphaFold3的研究人员来说,推荐的方法是通过WSL2(Windows Subsystem for Linux 2)来创建一个Linux环境[^1]。一旦设置了WSL2并选择了合适的Linux发行版之后,就可以按照Linux下的说明继续操作。 为了简化过程,在Windows上的另一种选择是利用Docker容器技术。这可以通过下载官方提供的Docker镜像文件实现自动化配置所需的依赖关系和库版本控制[^2]。 #### macOS 上的安装指南 针对macOS用户而言,由于其基于Unix的操作系统特性,可以直接参照Linux部分来进行设置。然而需要注意的是,某些特定硬件加速功能可能无法得到充分利用,因为并非所有的GPU都支持必要的CUDA驱动程序。因此建议先确认设备兼容性再做决定是否采用此路径前进。 另外一种方式是在Mac电脑上面使用虚拟机软件如VirtualBox或者Parallels Desktop加载Ubuntu等linux发行板从而间接完成部署工作;又或者是借助Homebrew包管理器配合Conda环境构建工具达成目的。 #### Linux 上的具体步骤 当涉及到具体执行命令时,则主要集中在以下几个方面: - **准备阶段**:确保已更新系统的软件源列表,并安装基本开发工具集以及Python解释器。 - **环境搭建**:创建独立的工作空间用于存放项目代码及相关数据集;激活virtualenv或conda virtual environment以隔离全局环境的影响。 - **获取资源**:克隆GitHub仓库中的AlphaFold3源码至本地目录下;依据README文档指示下载预训练模型参数及其他辅助材料。 - **编译与测试**:根据个人需求调整Makefile里的选项开关后尝试编译整个工程;最后跑一遍自带的例子验证一切正常运作即可。 ```bash # 更新apt-get索引并安装基础组件 sudo apt update && sudo apt install -y build-essential git python3-pip wget # 创建一个新的conda环境名为alphafold_env conda create --name alphafold_env python=3.8 conda activate alphafold_env # 使用pip安装其他必需品 pip install --upgrade pip setuptools wheel pip install tensorflow==2.5.0 jax jaxlib dm-haiku ml-collections numpy scipy matplotlib pandas seaborn absl-py chex reverb optax biopython openmm openmmplugin pdbfixer isambard py3dmol kalignprogs # 下载AlphaFold3源代码 git clone https://github.com/deepmind/alphafold.git ~/alphafold cd ~/alphafold # 设置环境变量指向OpenMM插件位置 export OPENMM_PLUGIN_DIR=/usr/local/lib/plugins/ # 运行预测示例脚本 python3 run_alphafold.py \ --fasta_paths=<path_to_your_protein_sequence_file> \ --output_dir=./results/ ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_21478261

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值