8、起始密码子识别与棒球比赛中的隐马尔可夫模型应用

起始密码子识别与棒球比赛中的隐马尔可夫模型应用

1. 起始密码子识别

1.1 数据收集

在起始密码子识别的研究中,需要将相关字符串数据分为三组,其中一组用于训练,另外两组用于测试。以下是实现数据收集的 GatherData 函数代码:

# yin13.py
def GatherData(sname ,nname ,pct):
    with open(sname) as f:
        data = f.read ().splitlines ()
    np.random.shuffle(data)
    N = int(pct*len(data))
    trainstarts = data [:N]
    notrainstarts = data[N:]
    with open(nname) as f:
        nonstarts = f.read ().splitlines ()
    np.random.shuffle(nonstarts)
    return trainstarts , notrainstarts , nonstarts

datadir = # your data directory
np.random.seed( 279 )
starts1 , starts2 , nostarts = GatherData(datadir+'starts.txt', datadir+'nonstarts.txt', 0.1)
print(len(starts1), len(starts2), len(nostarts))
</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值