生物信息学中的机器学习应用
1. 机器学习简介
生物数据具有复杂性和海量性,传统计算机科学技术与算法难以解决现实世界中的复杂生物问题。而机器学习这种现代计算方法,能够弥补传统技术的局限。它是一个自适应过程,让计算机可以从经验、示例中学习,还能进行类比学习。通过以往结果,不断自动提升计算系统的性能。
1.1 基本学习模型组件
一个基本的学习模型通常包含以下四个组件:
- 学习元素:负责提升性能。
- 性能元素:决定采取的行动。
- 关键元素:告知学习元素算法的执行情况。
- 问题生成器:提出能带来新体验或有用信息的行动建议。
1.2 机器学习的阶段
机器学习一般可分为三个阶段:
1. 分析训练示例集,并从训练集中生成规则集。
2. 由人类专家或基于自动知识的组件验证规则。
3. 使用经过验证的规则来响应新的测试数据集。
1.3 机器学习广泛应用的原因
机器学习在实践中,尤其是生物信息学领域广泛应用,原因如下:
- 传统专家系统构建时,专家虽能解释评估情况的因素,但难以说明所用规则,机器学习可解决此问题,提取隐藏情况描述并触发匹配专家行为的规则。
- 系统结果常与预期不符,可能因设计时输入的未知属性或功能,机器学习凭借动态改进能力可应对。
- 分子生物学研究中,新数据和概念不断更新,机器学习能适应变化环境,减轻系统设计师重新设计系统的负担。
- 生物数据存在缺失和噪声,传统计算机技术难以处理,机器学习技术可应对。
- 生物技术发展产生大量生物数据,可能存在重要隐藏关系,机器学
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



