真核生物蛋白质组中氨基酸缺失的全蛋白质组分析
1. 引言
蛋白质的独特有序序列由 DNA 编码序列决定,包含二十种不同数量和类型的氨基酸。这些氨基酸不仅是构建蛋白质三维结构的结构元素,大多数还能进行翻译后修饰(PTMs)。PTMs 对调节蛋白质的功能和动态起着重要作用,参与众多细胞过程。目前已发现超过 350 种 PTMs,除了五种疏水残基(L、I、V、A 和 F)外,共有十五种氨基酸可以被修饰。
每种 PTM 只能特异性地修饰一种或几种氨基酸,因此理论上,缺少特定氨基酸的蛋白质可能会阻止某些 PTMs。例如,不含 K 的蛋白质不会被 SUMO 化和泛素化,缺少 Y 残基的蛋白质可防止酪氨酸磷酸化,没有 C 的蛋白质可能不会被 S - 棕榈酰化。那么,在真核生物中,有多少蛋白质至少缺少一种类型的氨基酸(AAA 蛋白)呢?
为了解决这个问题,我们对六种真核生物(酿酒酵母、裂殖酵母、秀丽隐杆线虫、果蝇、小鼠和人类)的蛋白质序列进行了全蛋白质组分析,以计算 AAA 蛋白的数量。
2. 材料与方法
2.1 六种生物蛋白质序列的数据准备
我们选择了六种真核生物的蛋白质组进行分析。蛋白质序列从 ExPASy 网站的序列检索系统(SRS5)获取,使用每种生物的分类代码(TaxID)从 Swiss - Prot & TrEMBL 数据库中查询蛋白质序列。
由于许多蛋白质序列是片段形式,短片段序列可能经常缺少一种或几种氨基酸,为避免偏差,我们使用“fragment”关键字结合每个 TaxID 分别查询六种生物中的片段蛋白,然后去除这些片段序列,并重新计算 AAA 蛋白。具体数据准备信息如下表所示:
超级会员免费看
订阅专栏 解锁全文
674

被折叠的 条评论
为什么被折叠?



