为什么需要分子数据库?
数据库记录包括两部分:
1.原始序列数据
2.描述原始数据的生物学信息的注释
随着研究的积累,生物信息数据越来越多,且在研究中,如果仅仅知道数据的来源
而对其他方面知之甚少,研究也会变得极为困难。
所以为了研究的便利,能够对数据进行存储共享和使用,所以分子数据库应运而生。
分子数据库
数据库数量多
数据库种类复杂
数据量巨大且不断增长
数据间关系复杂
数据存在冗余和偏差
版本不断更新
提供开源web服务
分子数据库种类繁多,但是主要可以分为三大类:
1.核酸数据库
2.蛋白质数据库
3.其他数据库
数据存储格式
分子数据库数据库数据量巨大且增长速度快,数据之间关系复杂,为了方便对数据的收集,整理,分析,所以规范了数据的格式。
FASTA格式
1.基于文本形式的数据存储格式,格式中碱基对或氨基酸用单个字母表示。