PST-PRNA 项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01098/article/details/142192183

PST-PRNA 项目使用教程

PST-PRNA 项目地址: https://gitcode.com/gh_mirrors/ps/PST-PRNA

1. 项目目录结构及介绍

PST-PRNA 项目的目录结构如下：

PST-PRNA/
├── data/
│   └── pdbid_chain/
├── data_loader/
├── default_config/
│   └── bin_path.py
├── features/
├── img/
├── nn_module/
├── LICENSE
├── README.md
├── citation.bib
├── predict.py
├── prepare_all.py
├── prepare_all.slurm
├── protein.py
├── protein_for_predict.py
└── train.py

目录结构介绍

data/: 存放项目所需的数据文件，特别是 pdbid_chain/ 目录，用于存储 PDB ID 列表。
data_loader/: 包含数据加载相关的代码。
default_config/: 存放项目的默认配置文件，如 bin_path.py，用于指定可执行文件的路径。
features/: 存放特征提取相关的代码。
img/: 存放项目生成的图像文件。
nn_module/: 包含神经网络模型相关的代码。
LICENSE: 项目的开源许可证文件。
README.md: 项目的说明文档。
citation.bib: 项目的引用信息。
predict.py: 用于预测 RNA-binding 位点的脚本。
prepare_all.py: 用于准备所有数据的脚本。
prepare_all.slurm: 用于并行计算的 SLURM 脚本。
protein.py: 包含处理蛋白质数据的类 RBP。
protein_for_predict.py: 用于预测蛋白质数据的脚本。
train.py: 用于训练模型的脚本。

2. 项目启动文件介绍

`train.py`

train.py 是项目的启动文件之一，用于训练模型。使用方法如下：

python train.py

在训练模型之前，需要确保配置文件 default_config/dir_options 中指定了正确的 RBPs 列表。

`predict.py`

predict.py 是用于预测 RNA-binding 位点的启动文件。使用方法如下：

设置 default_config 中的 dir_opts['PDB_list_to_predict']，指向包含 PDB 名称的列表文件。
将 PDB 文件移动到 dir_opts['raw_pdb_dir'] 目录。
执行以下命令：

python prepare_all.py
python predict.py

3. 项目的配置文件介绍

`default_config/bin_path.py`

bin_path.py 是项目的配置文件之一，用于指定可执行文件的路径。例如：

# bin_path.py
reduce_path = "/path/to/reduce"
msms_path = "/path/to/msms"
psiblast_path = "/path/to/psiblast"
hhblits_path = "/path/to/hhblits"
cdhit_path = "/path/to/cd-hit"
dssp_path = "/path/to/dssp"

`default_config/dir_options`

dir_options 是另一个重要的配置文件，用于指定数据和模型的路径。例如：

# dir_options
PDB_list_to_predict = "data/pdbid_chain/pdb_list.txt"
raw_pdb_dir = "data/raw_pdb"
model_dir = "models"

通过这些配置文件，用户可以自定义项目的运行环境和数据路径。

PST-PRNA 项目地址: https://gitcode.com/gh_mirrors/ps/PST-PRNA

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考