DrugCell 项目使用教程
1. 项目目录结构及介绍
DrugCell 项目的目录结构如下:
DrugCell/
├── code/
│ ├── ... (各种代码文件)
├── data/
│ ├── ... (数据文件)
├── environment_setup/
│ ├── ... (环境配置文件)
├── misc/
│ ├── ... (其他文件)
├── pretrained_model/
│ ├── ... (预训练模型文件)
├── sample/
│ ├── ... (示例文件)
├── .gitattributes
├── LICENSE
├── README.md
目录介绍:
- code/: 包含项目的核心代码文件,用于训练和测试模型。
- data/: 包含项目所需的数据文件,如基因、细胞和药物的特征文件。
- environment_setup/: 包含用于设置项目运行环境的配置文件。
- misc/: 包含一些杂项文件,可能包括一些辅助工具或脚本。
- pretrained_model/: 包含预训练的模型文件,可以直接用于预测。
- sample/: 包含一些示例文件,用于演示如何使用项目。
- .gitattributes: Git 属性文件,用于配置 Git 仓库的行为。
- LICENSE: 项目的许可证文件,说明项目的使用条款。
- README.md: 项目的说明文件,包含项目的概述、安装和使用说明。
2. 项目启动文件介绍
DrugCell 项目的启动文件主要是 predict_drugcell.py
和 predict_drugcell_cpu.py
。这两个文件分别用于在 GPU 和 CPU 上运行预训练模型进行预测。
predict_drugcell.py
该文件用于在 GPU 上运行预训练模型进行预测。主要参数如下:
-gene2id
: 基因索引文件路径。-cell2id
: 细胞索引文件路径。-drug2id
: 药物索引文件路径。-genotype
: 细胞突变状态文件路径。-fingerprint
: 药物指纹文件路径。-predict
: 测试数据文件路径。-hidden
: 存储隐藏值的目录路径。-result
: 存储预测结果的目录路径。-load
: 预训练模型文件路径。-cuda
: 使用的 GPU 单元。
predict_drugcell_cpu.py
该文件用于在 CPU 上运行预训练模型进行预测。参数与 predict_drugcell.py
类似,但没有 -cuda
参数。
3. 项目的配置文件介绍
DrugCell 项目的配置文件主要集中在 environment_setup/
目录下,用于设置项目的运行环境。
environment.yml
该文件用于创建一个包含所有依赖项的 Conda 虚拟环境。主要内容如下:
name: pytorch3drugcell
channels:
- pytorch
- defaults
dependencies:
- python=3.6
- pytorch
- torchvision
- cudatoolkit=10.1
- networkx
- numpy
environment_cpu_mac.yml
和 environment_cpu_linux.yml
这两个文件分别用于在 Mac OS X 和 Linux 系统上创建一个基于 CPU 的 Conda 虚拟环境。内容与 environment.yml
类似,但去掉了 cudatoolkit
依赖。
使用方法
在终端中运行以下命令来创建虚拟环境:
conda env create -f environment.yml
创建完成后,激活虚拟环境:
source activate pytorch3drugcell
然后即可运行项目代码。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考