人工神经网络与集成学习在数据处理中的应用
1. 背景知识
1.1 数据挖掘与可视化
数据挖掘是从大量数据中筛选出相关信息的过程。它广泛应用于商业智能组织和金融分析领域,并且在现代科学研究中也越发重要,因为现代实验和观测方法会产生海量的数据。数据挖掘被定义为“从数据中提取隐含的、先前未知的且潜在有用的信息”,而数据可视化是数据挖掘中常用的信息提取技术之一。
1.2 人工神经网络
人工神经网络是对动物大脑中真实神经网络某些特征的软件模拟,属于人工智能的一个分支。它由连接主义系统组成,根据其神经网络架构有不同的应用,如模式识别、信息压缩、降维、聚类、分类和可视化等。这些任务也属于数据挖掘的范畴,因此人工神经网络工具在数据挖掘中很有用。这里主要探讨采用无监督学习算法的人工神经网络,即网络不会使用包含预标记数据的数据集进行训练。
2. 人工神经网络建模
2.1 人工神经网络基础
在人工神经网络中,输出 (y_i) 可以通过以下公式计算:
[y_i = \sum_{j} W_{ij}x_j]
其中,(W_{ij}) 表示第 (j) 个输入和第 (i) 个输出之间的权重向量。
2.2 赫布学习规则
赫布学习规则定义为:
[\Delta W_{ij} = \eta(x_jy_i)]
其中,(\eta) 是学习率参数。这意味着每个输入和输出神经元之间的权重会与这些神经元同时激发的强度成正比增加。将 (y) 的值引入学习规则(通过活动的前馈步骤计算),可以得到:
[\Delta W_{ij} = \eta x_j \sum_{k} W_{i
超级会员免费看
订阅专栏 解锁全文
649

被折叠的 条评论
为什么被折叠?



