30、蛋白质序列分析与微阵列数据分析

蛋白质序列分析与微阵列数据分析

1. 蛋白质序列的测量表示转换

在对蛋白质进行分析时,首先要将蛋白质的氨基酸序列转换为测量表示,这里选取 K = 5。这是因为 K 值的大小会影响转换结果:
- 若 K 过小,集合 {0, 1, 2, 3} 中字母的组合数量不足,导致结果缺乏统计意义。
- 若 K 过大,大多数子串的频率为零,测量表示无法提供有效的生物信息。考虑到所选蛋白质的长度在 350 到 1000 之间,K = 5 是比较合适的选择。

2. IFS 和 RIFS 模型模拟蛋白质测量表示

使用 IFS 和 RIFS 模型对 32 种蛋白质的测量表示进行模拟。研究发现:
- IFS 是基于详细的蛋白质 HP 模型模拟测量表示的良好模型。
- 在模拟蛋白质序列的测量表示方面,IFS 模型优于 RIFS 模型。32 种蛋白质的 IFS 模型估计参数如下表所示(此处虽未给出具体表格,但可想象表格包含蛋白质编号、各参数值等信息):
| 蛋白质编号 | 参数 p1 | 参数 p2 | 参数 p3 |… |
| ---- | ---- | ---- | ---- | ---- |
| 1 |… |… |… |… |
| 2 |… |… |… |… |
|… |… |… |… |… |

3. 概率在区分蛋白质类别中的应用

一旦确定了概率,IFS 模型就可用于蛋白质序列的测量表示。从相关数据中发现:
- 概率 p3(对应不带电的极性属性)可用于区分 α 类和 β 类蛋白质,α 类蛋白质的 p3 值小于 β 类蛋白质。
- 概率 p1(对应非

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值