化学VAE项目开源教程

化学VAE项目开源教程

chemical_vae Code for 10.1021/acscentsci.7b00572, now running on Keras 2.0 and Tensorflow chemical_vae 项目地址: https://gitcode.com/gh_mirrors/ch/chemical_vae

1. 项目介绍

本项目是基于变分自编码器(VAE)的开源项目,用于处理化学分子结构的SMILES表示。VAE能够将SMILES编码为一个向量表示,并可以从该向量解码回SMILES。此外,VAE还可以与属性预测任务联合训练,以优化潜在空间,进而发现具有最优属性的分子。本项目使用了ZINC数据集,并在预测logP、QED和SAS属性时对潜在空间进行优化。

2. 项目快速启动

首先,确保您的环境中安装了以下依赖项:

  • Python 3.5或更高版本
  • Keras 2.0.0至2.0.7版本
  • Tensorflow 1.1版本
  • RDKit
  • Numpy
  • Jupyter Notebook(用于运行ipynb示例)

创建虚拟环境

conda env create -f environment.yml
source activate chemvae

安装项目:

python setup.py install

或者使用pip:

pip install git+https://github.com/aspuru-guzik-group/chemical_vae.git

运行VAE

在包含exp.json的目录下运行以下命令:

python -m chemvae.train_vae

确保复制示例目录,以避免覆盖训练好的权重文件(*.h5)。

3. 应用案例和最佳实践

示例:ZINC数据集

本项目包含一个如何使用VAE处理ZINC数据集的示例。查看zinc目录,参数设置在以下json文件中:

  • exp.json:设置数据位置、实验参数、训练轮数、预测属性等。
  • params.json:可以覆盖exp.jsonhyperparameters.py中的参数设置。

设置完参数后,使用上述命令启动VAE训练。

4. 典型生态项目

本项目的生态系统中包括了以下组件:

  • train_vae.py:训练VAE的主脚本。
  • models.py:包含编码器、解码器和属性预测模型的库。
  • tgru_k2_gpu.py:包含自定义教师强制/采样功能的keras层。
  • sampled_rnn_tf.py:为tgru_k2_gpu.py编写的自定义RNN函数,基于tensorflow后端。
  • hyperparameters.py:VAE的一些默认参数设置。
  • mol_utils.py:用于将SMILES转换为one-hot编码和反向转换的库。
  • mol_callbacks.pytrain_vae.py中使用的回调库。
  • vae_utils.py:用于VAE对象的后期处理工具函数。

以上就是关于化学VAE项目的开源教程,希望能够帮助您快速上手并有效地使用该项目。

chemical_vae Code for 10.1021/acscentsci.7b00572, now running on Keras 2.0 and Tensorflow chemical_vae 项目地址: https://gitcode.com/gh_mirrors/ch/chemical_vae

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

葛习可Mona

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值