NCBI(National Center for Biotechnology Information)
美国国立生物技术信息中心是美国政府为了更好的处理大量出现的生物数据而于1988年建立的机构;由美国国立卫生研究中心(NIH)的美国国家医学图书馆(NLM)开发维护
NCBI的数据库归类
主要数据库
如GeneBank
衍生数据库
1、如NCBI RefSeq mRNA
2、机器处理数据,如UniGene
【扩展】RNA层面数据:表达标签序列(ESTs)
表达序列标签数据库(dbEST)是GenBank数据库的子库,它收录了一系列物种中的单次测序的cDNA序列数据和相关信息。一个EST是一个cDNA克隆的一部分DNA序列。所有cDNA克隆以及由此而来的所有EST数据都来源于特定RNA源,如人脑或大鼠的肝脏。RNA被转换成更稳定的cDNA分子,许多cDNA分子组成一个cDNA文库。目前GenBank把EST分为三大类:人类、小鼠和其他生物。
RNA层面数据:UniGene(特异基因)
UniGene项目的目的是通过把EST自动分成不冗余的集合从而创造出基因源簇,这样最终只会有一个UniGene簇对应到一个物种中每一基因上。
3、数据整合,如NCBI Genome Assembly
GeneBank
GeneBank数据库是NCBI最主要的序列数据库
特征:核酸序列数据库&