真菌基因组学的数据管理实践
1. 项目背景与现有系统
在项目开始时,用于表达序列标签(EST)处理、注释和管理的系统较少。不过,随后出现了一些用于 EST 处理和初步注释的系统。
2. 微阵列数据库
在项目开展前,微阵列新技术引发了极大关注,尤其是如何有意义地存档和共享实验数据。这促使了数据记录标准(MIAME)的产生,以及多个开源系统和用于统计分析工具的开源项目(Bioconductor)的出现。我们采用了来自瑞典隆德的 BASE 系统,它符合 MIAME 标准,能记录微阵列实验的所有元数据、数据和数据分析结果,还具备插件架构以添加新的分析工具,我们添加了来自 TIGR 的 MEV 套件、Bioconductor 的工具以及我们自己开发的工具。
MIAME 的元数据要求广泛,涵盖微阵列的设计和生产、样本的来源和制备,以及实验的提取、标记、杂交、扫描和分析步骤的协议。同时会收集质量控制数据和实验结果。
微阵列能提供特定条件下(如真菌生长条件)生物体每个基因的表达水平信息。目前,直到确定具有统计学显著表达变化的基因集的基础数据分析已较为成熟,其他技术还包括聚类和通路分析。然而,解释这些变化的生物学原因极为困难,且因实验而异,这在很大程度上依赖于物种基因的注释情况,通常约 30%的基因注释良好,30%的基因无注释,20%的基因处于虽有一定了解但基因功能未真正明确的灰色地带。
以下是微阵列数据库相关要点总结:
|要点|详情|
| ---- | ---- |
|标准|MIAME|
|采用系统|BASE 系统|
|记录内容|元数据、数据、数据分析结果|
|分析工具|M
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



