生物医学数据资源与应用
1. 数据资源概述
在生物医学领域,存在着丰富多样的数据资源,这些资源对于研究和创新至关重要。Affymetrix GeneChip Human Genome U133A Array 存储在 Connectivity Map 中。而 Library of Integrated Network - based signatures L1000(LINCS 数据集)则包含了多达 77 种用各种化合物处理过的细胞系的显微镜图像以及基因表达数据。
1.1 蛋白质组学研究资源
欧洲生物信息学研究所(EBI)为蛋白质组学研究提供了众多资源,其中包括 UniProt KnowledgeBase(UniProtKB)和 PRIDE。
- UniProtKB :它提供了免费的蛋白质数据资源,如蛋白质序列和功能信息。UniProtKB 分为两部分,手动注释和审核的部分称为 UniProtKB/Swiss - Prot;通过计算注释且未审核的部分是 UniProtKB/TrEMBL。由于采用计算注释,EBI 表示该数据库对蛋白质组的注释覆盖率很高,这些数据可用于寻找蛋白质功能或亚细胞定位的证据。
- PRIDE :包含蛋白质和肽的鉴定信息(如翻译后修饰的细节)以及质谱分析的证据。
1.2 蛋白质结构信息资源
随着蛋白质组学数据的大量产生,数据存储库和数据库的数量也在不断增加。Protein DataBank 专注于蛋白质的结构信息,如蛋白质的 3D 形状,由 RCSB 维护。为了应对数据格式的问题,HUPO Proteomics Sta
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



