生信自学笔记(三)分子数据库

分类

  • 基因组数据库:GDB、GenBankEnsembl

  • 核酸数据库:ENA(EMBL)、GenBank、DDBJ

  • 蛋白质数据库:SWISS-PROF、PIR、PDB

一个数据库记录由两部分组成:原始序列数据和描述这些数据生物学信息的注释。

记录格式

  • FASTA

在生物信息学中,FASTA 格式是一种用于记录核酸序列或肽序列的文本格式,其中的核酸或氨基酸均以单个字母编码呈现。该格式同时还允许在序列之前定义名称和编写注释。这一格式最初由 FASTA 软件包定义,但现今已是生物信息学领域的一项标准。

FASTA 格式中的一条完整序列,包含开头的单行描述行和多行序列数据。描述行行首前置半角大于号(“>”)以和数据行区分。“>” 后紧接的内容为该序列的标识符,该行剩余部分则为序列的描述(标识符与描述均非必须)。“>” 和标识符之间不应有空格,且建议将单行内容限制在 80 字符以内。序列的结束以下一条序列的 “>” 出现为标识。如下为 FASTA 格式一条序列的示例:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

羊城迷鹿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值