86、基于多元线性回归的标签SNP选择与最小多色子图问题研究

基于多元线性回归的标签SNP选择与最小多色子图问题研究

在生物信息学领域,标签SNP选择和最小多色子图问题是两个重要的研究方向。标签SNP选择有助于提高基因分型和单倍型分析的效率,而最小多色子图问题则在多重PCR引物集选择和群体单倍型推断中有着广泛的应用。

标签SNP选择方法
  • 逐步标签选择算法(STA) :STA从一个初始标签开始,逐步添加最优标签,直到达到指定大小的标签集合。该算法产生的标签集合具有遗传性,即选择的k个标签包含选择的k - 1个标签。STA的运行时间为O(knmT),其中T是预测算法的运行时间。对于统计覆盖,STA等同于Carlson等人使用的贪心算法。
  • 局部最小化标签选择算法(LMT) :LMT从STA产生的k个标签开始,迭代地将每个单个标签替换为最佳选择,同时不改变其他标签。这种替换将继续进行,直到预测质量没有显著改善(即改善幅度不超过给定的ϵ%)。LMT的运行时间为O(knmTϵ⁻¹),因为迭代次数不能超过100/ϵ。
实验数据集

为了评估算法的性能,使用了以下数据集:
| 数据集 | 详细信息 |
| — | — |
| 三个ENCODE区域 | 从HapMap ENCODE项目的30个CEPH家系三人组中获得的三个区域(ENm013、ENr112、ENr113),每个区域的SNP基因分型数量分别为361、412和515。 |
| 两个基因区域 | 从HapMap的30个CEPH家系三人组中获得的两个基因区域STEAP和TRPM8,每个基因区域的SNP基因分型数量分

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值