15、基因组学中的无监督学习技术及其应用

基因组学中的无监督学习技术及其应用

1. 机器学习简介

学习是获取知识或提升现有知识的过程。最初,人类和动物具备学习能力,如今机器也拥有了这种能力。机器学习是对算法进行系统研究和开发,使其能通过经验不断改进。例如,在基因组学中,机器学习可用于识别基因组序列中转录起始位点(TSS)的位置。它能帮助我们发现人类未知的新结构,如数据挖掘,可在复杂数据中找到隐藏模式,并尝试做出决策或预测未来决策。

机器学习主要分为两类:
- 监督学习 :在这种机器学习技术中,我们预先确定输出,函数将输入映射到期望的输出。这种预先给定期望输出的学习技术被称为监督学习,期望输出被称为目标。
- 无监督学习 :在这类学习技术中,我们从包含输入数据但没有明确标记输出的数据集里寻找解释。数据集里的数据通过各种机器学习方法进行处理,这种方法被称为无监督学习,常用的算法是聚类分析,用于探索一组数据中的隐藏信息。

2. 生物信息学中的机器学习

生物信息学是一门跨学科的科学,通常采用计算方法处理生物数据。机器学习利用从数据集中自动学习的技术。DNA序列分类器的任务是学习用于基因组研究的新蛋白质的功能。最初,生物信息学算法需要明确编程来解决诸如预测蛋白质结构等难题。深度学习技术能自动学习数据集的所有特征,然后创建一个抽象数据集,用于未来的学习。这种多层方法有助于在处理大量数据时预测复杂的数据集。

机器学习技术可应用于生物信息学的六个主要子领域:
|子领域|简介|
| ---- | ---- |
|基因组学|生物技术的一个分支,结合遗传学和分子生物学方法,对

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值