Drug Repurposing Knowledge Graph (DRKG) 使用教程
1. 项目目录结构及介绍
DRKG 项目目录结构如下:
.
├── drkg.tsv
├── entity2src.tsv
├── relation_glossary.tsv
├── embed
│ ├── DRKG_TransE_l2_entity.npy
│ ├── relations.tsv
│ ├── entities.tsv
│ ├── DRKG_TransE_l2_relation.npy
│ ├── mol_contextpred.npy
│ ├── mol_masking.npy
│ ├── mol_infomax.npy
│ └── mol_edgepred.npy
└── README.md
文件说明:
drkg.tsv
:包含原始 DRKG 数据的 TSV 文件,格式为 (头实体, 关系, 尾实体) 三元组。entity2src.tsv
:映射实体到其原始数据源的文件。relation_glossary.tsv
:包含关系 glossary 的文件,提供关系的详细信息。embed
:预训练知识图谱嵌入的文件夹,包含以下文件:DRKG_TransE_l2_entity.npy
:存储实体嵌入的 NumPy 二进制文件。DRKG_TransE_l2_relation.npy
:存储关系嵌入的 NumPy 二进制文件。entities.tsv
:实体名称到实体 ID 的映射。relations.tsv
:关系名称到关系 ID 的映射。- 其他
.npy
文件:存储不同预训练分子嵌入的文件。
README.md
:项目的说明文件。
2. 项目的启动文件介绍
本项目没有特定的启动文件。若要使用 DRKG 数据,可以直接下载 drkg.tsv
文件,或者使用项目提供的 Jupyter 笔记本,它们会自动下载所需的数据文件。
3. 项目的配置文件介绍
本项目没有特定的配置文件。使用预训练的嵌入或分析 DRKG 时,需要根据具体的分析工具或模型来设置参数。例如,如果使用 DGL 和 DGL-KE 框架进行分析,需要安装相应的 Python 包,并按照以下命令进行安装:
sudo pip3 install torch==1.5.0+cu101 torchvision==0.6.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html
sudo pip3 install dgl-cu101
sudo pip3 install dglke
在安装完所需的包后,可以使用项目提供的 Jupyter 笔记本进行进一步的分析和操作。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考