生物信息学中的机器学习:神经网络与遗传算法
1. 神经网络概述
神经网络是受生物学习系统(如人类大脑)启发而产生的并行分布式信息处理系统。其架构由非线性信息处理元素组成的网络构成,这些元素通常分层排列并并行执行,这种分层排列被称为神经网络的拓扑结构。网络中的非线性信息处理元素称为神经元,神经元之间的互连称为突触或权重。为了使神经网络能够以有用和有意义的方式处理信息,必须使用学习算法对其进行训练。
神经网络在模式分类、语言处理、复杂系统建模、控制、优化和预测等众多领域都有广泛应用,在生物信息学中也有诸多应用,如DNA序列预测、蛋白质二级结构预测、基因表达谱分类和基因表达模式分析等。
2. 神经网络架构
2.1 前馈神经网络
- 感知机 :感知机是最基本、最简单的前馈神经网络模型,由输入层和单个输出层的处理单元(节点)组成。输入层神经元接收到的输入值直接映射到输出层神经元,没有中间处理步骤。每个输入都与一个权重相关联,以反映该输入对输出的重要性。通过向感知机提供输入模式并最小化其输出与期望输出之间的误差来进行训练。由于感知机进行的是输入到输出的直接映射,它是一种线性分类器,只能用其权重定义一个超平面将输入空间划分为模式类区域,因此无法执行需要输入和输出之间非线性映射的任务。
- 多层感知机(MLP) :对于更复杂的问题,线性超平面作为分隔器不够理想,需要使用非线性表面来分隔类别,这可以通过多层感知机实现。MLP是一种包含三层节点(神经元)的前馈网络,除了输入层和输出层外,中间还有一个(或多个)隐藏层。
超级会员免费看
订阅专栏 解锁全文
2877

被折叠的 条评论
为什么被折叠?



