用Python将GO数据库中obo文件解析成Pandas的DataFrame

最新推荐文章于 2025-06-14 11:34:50 发布

原创

最新推荐文章于 2025-06-14 11:34:50 发布 · 1.3k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#python

最近做的课题需要构建一个生物机制的大网络，其中需要GO本体之间关系的数据，但官网只能下到obo格式的文件，它的数据结构大致长这样：

format-version: 1.2
data-version: releases/2023-01-01
subsetdef: chebi_ph7_3 "Rhea list of ChEBI terms representing the major species at pH 7.3."
subsetdef: gocheck_do_not_annotate "Term not to be used for direct annotation"
subsetdef: gocheck_do_not_manually_annotate "Term not to be used for direct manual annotation"
subsetdef: goslim_agr "AGR slim"
subsetdef: goslim_aspergillus "Aspergillus GO slim"
subsetdef: goslim_candida "Candida GO slim"
subsetdef: goslim_chembl "ChEMBL protein targets summary"
subsetdef: goslim_drosophila "Drosophila GO slim"
subsetdef: goslim_flybase_ribbon "FlyBase Drosophila GO ribbon slim"
subsetdef: goslim_generic "Generic GO slim"
subsetdef: goslim_metagenomics "Metagenomics GO slim"
subsetdef: goslim_mouse "Mouse GO slim"
subsetdef: goslim_pir "