Mol2vec 项目使用教程
项目地址:https://gitcode.com/gh_mirrors/mo/mol2vec
1. 项目的目录结构及介绍
Mol2vec 项目的目录结构如下:
mol2vec/
├── docs/
├── examples/
├── mol2vec/
│ ├── features.py
│ ├── helpers.py
│ └── __init__.py
├── .gitignore
├── LICENSE
├── README.md
├── TODO.md
├── azure-pipelines.yml
├── requirements.txt
├── setup.cfg
└── setup.py
目录结构介绍
- docs/: 包含项目的文档文件,可以使用 Sphinx 生成 HTML 文档。
- examples/: 包含使用 Mol2vec 的示例代码。
- mol2vec/: 项目的主要代码目录,包含功能模块和辅助函数。
- features.py: 包含生成分子“句子”和训练模型的函数。
- helpers.py: 包含一些有用的辅助函数。
- init.py: 使目录成为一个 Python 包。
- .gitignore: 指定 Git 版本控制系统忽略的文件和目录。
- LICENSE: 项目的许可证文件,采用 BSD-3-Clause 许可证。
- README.md: 项目的介绍和使用说明。
- TODO.md: 项目待办事项列表。
- azure-pipelines.yml: Azure Pipelines 的配置文件。
- requirements.txt: 项目依赖的 Python 包列表。
- setup.cfg: 安装配置文件。
- setup.py: 用于安装项目的脚本。
2. 项目的启动文件介绍
Mol2vec 项目的启动文件主要是 setup.py
,它用于安装项目和其依赖项。
setup.py
setup.py
文件的主要作用是定义项目的元数据和依赖项,并提供一个命令行接口来安装项目。以下是 setup.py
的基本结构:
from setuptools import setup, find_packages
setup(
name='mol2vec',
version='0.1',
packages=find_packages(),
install_requires=[
'numpy',
'pandas',
'scikit-learn',
'gensim',
'tqdm',
'joblib',
'RDKit'
],
author='Samot Turk',
author_email='samot.turk@example.com',
description='An unsupervised machine learning approach to learn vector representations of molecular substructures',
license='BSD-3-Clause',
keywords='mol2vec molecular substructures',
url='https://github.com/samoturk/mol2vec',
)
使用方法
在项目根目录下运行以下命令来安装 Mol2vec:
pip install .
3. 项目的配置文件介绍
Mol2vec 项目的配置文件主要包括 setup.cfg
和 requirements.txt
。
setup.cfg
setup.cfg
文件包含了一些安装和构建文档的配置选项。以下是 setup.cfg
的基本结构:
[metadata]
name = mol2vec
version = 0.1
author = Samot Turk
author_email = samot.turk@example.com
description = An unsupervised machine learning approach to learn vector representations of molecular substructures
license = BSD-3-Clause
url = https://github.com/samoturk/mol2vec
[options]
packages = find:
install_requires =
numpy
pandas
scikit-learn
gensim
tqdm
joblib
RDKit
[options.package_data]
* = *.txt, *.md
[build_sphinx]
source-dir = docs/
build-dir = docs/_build
all_files = 1
requirements.txt
requirements.txt
文件列出了项目运行所需的 Python 包及其版本。以下是 requirements.txt
的内容:
numpy
pandas
scikit-learn
gensim
tqdm
joblib
RDKit
使用方法
在项目根目录下运行以下命令来安装依赖项:
pip install -r requirements.txt
以上是 Mol2vec 项目的目录结构、启动文件和配置文件的详细介绍
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考