核酸序列数据库主要包括了基因组DNA序列,mRNA序列,tRNA序列,rRNA序列等核酸序列。国家上有三个主要核苷酸序列公共数据库:
分别收集来自不同地区的数据,三大数据库进行数据共享且向世界开放。
核酸序列数据增长迅速,所以数据库版本更新较快,进行生物信息学分析时,务必注明数据库的数据状况及时间。
为维持数据的原始性,未经原作者允许,不能对原始数据库中的数据记录进行更新,修改,甚至加上注释,这就是一级数据库。
一级数据库
以Genbank为例:
Genbank
数据组织形式
数据库中数据量巨大且不断增长,为了方便数据的维护管理以及查询,将数据进行分类,分为不同的子数据库(不同的数据库分类依据略有不同):
- 种属来源
如哺乳类、啮齿类和病毒等
- 特点测序策略
主要依据序列来源分为专利、人工合成、表达序列标签(Expressed Sequence Tags,EST)、高通量

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



