PST-PRNA 项目使用教程
PST-PRNA 项目地址: https://gitcode.com/gh_mirrors/ps/PST-PRNA
1. 项目目录结构及介绍
PST-PRNA 项目的目录结构如下:
PST-PRNA/
├── data/
│ └── pdbid_chain/
├── data_loader/
├── default_config/
│ └── bin_path.py
├── features/
├── img/
├── nn_module/
├── LICENSE
├── README.md
├── citation.bib
├── predict.py
├── prepare_all.py
├── prepare_all.slurm
├── protein.py
├── protein_for_predict.py
└── train.py
目录结构介绍
- data/: 存放项目所需的数据文件,特别是
pdbid_chain/
目录,用于存储 PDB ID 列表。 - data_loader/: 包含数据加载相关的代码。
- default_config/: 存放项目的默认配置文件,如
bin_path.py
,用于指定可执行文件的路径。 - features/: 存放特征提取相关的代码。
- img/: 存放项目生成的图像文件。
- nn_module/: 包含神经网络模型相关的代码。
- LICENSE: 项目的开源许可证文件。
- README.md: 项目的说明文档。
- citation.bib: 项目的引用信息。
- predict.py: 用于预测 RNA-binding 位点的脚本。
- prepare_all.py: 用于准备所有数据的脚本。
- prepare_all.slurm: 用于并行计算的 SLURM 脚本。
- protein.py: 包含处理蛋白质数据的类
RBP
。 - protein_for_predict.py: 用于预测蛋白质数据的脚本。
- train.py: 用于训练模型的脚本。
2. 项目启动文件介绍
train.py
train.py
是项目的启动文件之一,用于训练模型。使用方法如下:
python train.py
在训练模型之前,需要确保配置文件 default_config/dir_options
中指定了正确的 RBPs 列表。
predict.py
predict.py
是用于预测 RNA-binding 位点的启动文件。使用方法如下:
- 设置
default_config
中的dir_opts['PDB_list_to_predict']
,指向包含 PDB 名称的列表文件。 - 将 PDB 文件移动到
dir_opts['raw_pdb_dir']
目录。 - 执行以下命令:
python prepare_all.py
python predict.py
3. 项目的配置文件介绍
default_config/bin_path.py
bin_path.py
是项目的配置文件之一,用于指定可执行文件的路径。例如:
# bin_path.py
reduce_path = "/path/to/reduce"
msms_path = "/path/to/msms"
psiblast_path = "/path/to/psiblast"
hhblits_path = "/path/to/hhblits"
cdhit_path = "/path/to/cd-hit"
dssp_path = "/path/to/dssp"
default_config/dir_options
dir_options
是另一个重要的配置文件,用于指定数据和模型的路径。例如:
# dir_options
PDB_list_to_predict = "data/pdbid_chain/pdb_list.txt"
raw_pdb_dir = "data/raw_pdb"
model_dir = "models"
通过这些配置文件,用户可以自定义项目的运行环境和数据路径。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考