机器学习与深度学习基础:从集成学习到神经网络
1. 集成学习与提升方法
在机器学习领域,集成学习是一种强大的技术,它将多个多样化的学习者组合在一起。其核心思想是收集多个相似类型但在不同数据上训练的学习者,让它们对输入进行评估,然后通过投票的方式确定输入的类别,得票最多的类别即为该输入的分类结果。这种方法的优势在于,单个学习者可能存在的错误可以通过其他学习者的共识投票来消除。
提升方法是集成学习的一种,它利用多个弱学习者组成一个强大的学习者。不过,需要注意的是,提升方法并非能改善所有分类算法。提升理论主要适用于二元分类问题,这也是它在决策树分类器中如此受欢迎且成功的部分原因。例如,图12 - 7和图12 - 13可视为决策树桩,因为它们只进行一次测试:样本是否在箭头所指直线的一侧。
2. 神经网络基础
深度学习算法基于构建相互连接的计算单元网络,其中基本单元是人工神经元,通常简称为神经元。人工神经元的灵感来源于人类神经元,人类神经元是构成大脑和中枢神经系统的神经细胞,在很大程度上决定了我们的认知能力。
2.1 真实神经元
在生物学中,神经元是分布在人体各处的各种复杂细胞。这些细胞结构和行为相似,但专门用于执行不同的任务。神经元通过化学、物理、电、时间、距离等多种方式进行信息处理和相互通信。
神经元接收的一种信息形式是神经递质,它们会暂时附着在神经元的受体位点上。这些结合在受体位点上的化学物质会引发电信号传入神经元体内,这些电信号有正有负。在短时间内到达神经元体的所有电信号会被相加,然后与一个阈值进行比较。如果总和超过阈值,就会沿着轴突发送一个新信号,促使特定数量的神经递质释放到环境中,这些分子再
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



