蛋白质组学数据管理:现状与未来展望
1. 蛋白质组学数据标准与模型
在蛋白质组学研究中,PSI - GPS致力于评估实验方法、结果和结论的相关性,同时也在开发共识对象模型(PSI - OM)和用于数据交换的XML格式(PSI - ML),以兼容标准数据格式。HUPO PSI - GPS和PSI - MS小组也开始构建本体,以支持各种PSI项目生成的所有格式。
2. 质谱数据的公共存储库
为满足快速发展的蛋白质组学领域的需求,建立集中的公共蛋白质组学数据存储库至关重要。以下是一些常见的公共存储库:
| 存储库名称 | 网址 | 特点 | 数据量 |
| — | — | — | — |
| PRIDE数据库 | http://www.ebi.ac.uk/pride | 由欧洲生物信息学研究所和根特大学联合开发,符合HUPO标准,可存储和检索蛋白质和肽鉴定及相关证据,以及实验的一般信息。采用Java 2和J2EE开发,使用XML作为基本数据结构,数据库管理系统从MySQL迁移到Oracle。 | 包含1,627个实验、178918个蛋白质鉴定和501296个支持肽鉴定 |
| 开放蛋白质组学数据库(OPD) | http://bioinformatics.icmb.utexas.edu/OPD/ | 存储基于质谱的蛋白质组学数据,包括实验的详细描述、设置、样本处理、原始质谱数据等。 | 约120万个代表四个不同生物体实验的光谱 |
| 肽图谱原始数据存储库 | http://www.peptideatlas.org/repository/ | 截至2007年7月,包含168个质谱实验数据集可供下载,数据集已发表或由数据生产者发布。P
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



