8、起始密码子识别与棒球比赛中的隐马尔可夫模型应用

最新推荐文章于 2025-10-14 23:53:25 发布

week9

最新推荐文章于 2025-10-14 23:53:25 发布

阅读量37

点赞数

CC 4.0 BY-SA版权

分类专栏： Python建模与仿真：从基础到实践文章标签：隐马尔可夫模型 HMM 起始密码子识别

本文链接：https://blog.youkuaiyun.com/week9/article/details/149521859

Python建模与仿真：从基础到实践专栏收录该内容

25 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

起始密码子识别与棒球比赛中的隐马尔可夫模型应用

1. 起始密码子识别

1.1 数据收集

在起始密码子识别的研究中，需要将相关字符串数据分为三组，其中一组用于训练，另外两组用于测试。以下是实现数据收集的 GatherData 函数代码：

# yin13.py
def GatherData(sname ,nname ,pct):
    with open(sname) as f:
        data = f.read ().splitlines ()
    np.random.shuffle(data)
    N = int(pct*len(data))
    trainstarts = data [:N]
    notrainstarts = data[N:]
    with open(nname) as f:
        nonstarts = f.read ().splitlines ()
    np.random.shuffle(nonstarts)
    return trainstarts , notrainstarts , nonstarts

datadir = # your data directory
np.random.seed( 279 )
starts1 , starts2 , nostarts = GatherData(datadir+'starts.txt', datadir+'nonstarts.txt', 0.1)
print(len(starts1), len(starts2), len(nostarts))
</